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本 书 是 The Linux Command Line 的 中 文 版 ， 除 了 可 以 在 gitbook 上 面 阅读 之 外 ， 你 也 可 以 点 击 下 面 链 接 阅 读本 书 : 
。 中 英文 混合 版 
e 中 文 版 (PDF-2014-9-26) 

本 书 的 翻译 由 好 奇 猫 团 队 发 起 ， 并 社区 协同 努力 (翻译 贡献 者 名 单 ) 


若 发 现 错误 ， 欢 迎 大 家 到 github 发 issue 


= 
ml 


我 想 给 大 家 讲 个 故事 。 

故事 内 容 不 是 Linus Torvalds 在 1991 年 怎样 写 了 Linux 内 核 的 第 一 个 版 本 ， 因为 这 些 内 容 你 可 以 在 许多 Linux 书籍 中 读 

到 。 我 也 不 想 告 诉 你 ， 更 时 之 前 ，Richard Stallman 是 如 何 开 始 GNU 项 目 ， 设 计 了 一 个 免费 的 类 似 Unix 的 操作 系统 。 那 也 
是 一 个 很 有 意义 的 故事 ， 但 大 多 数 Linux 书籍 也 讲 到 了 它 。 


我 想 告诉 大 家 一 个 你 如 何 才能 夺回 计算 机 管理 权 的 故事 。 





在 20 世 纪 70 年 代 末 ， 我 刚 开 始 和 计算 机 打交道 时 ， 正 进行 着 一 场 革命 ， 那 时 的 我 还 是 一 名 大 学 生 。 微 义理 器 的 发 明 ， 使 普通 
老百姓 (就 如 你 和 我 ) 真正 拥有 一 台 计 算 机 成 为 可 能 。 今 天 ， 人 们 难以 想象 ， 只 有 大 企业 和 强大 的 政府 才能 够 拥有 计算 机 的 
世界 ， 是 怎样 的 一 个 世界 。 简单 说 ， 你 做 不 了 多 少 事情 。 


今天 ， 世 界 已 经 截然 不 同 了 。 计 算 机 通 布 各 个 领域 ， 从 小 手表 到 大 型 数据 中 心 ， 及 大 小 介 于 它们 之 间 的 每 件 东西 。 除了 随处 
可 见 的 计算 机 之 外 ， 我 们 还 有 一 个 无 处 不 在 的 连接 所 有 计算 机 的 网 络 。 这 已 经 开创 了 一 个 人 们 可 以 自我 营造 和 自由 创作 的 奇 
妙 的 新 时 代 ， 但 在 过 去 的 二 三 十 年 里 ， 一 些 事情 仍然 在 发 生 着 改变 。 一 个 大 公司 不 断 地 把 它 的 管理 权 强加 到 世界 上 绝 大 多 数 
的 计算 机 上 ， 并 且 决 定 你 对 计算 机 的 操作 权力 。 幸 运 地 是 ， 来 自 世界 各 地 的 人 们 ， 正 积 极 努 力 地 做 些 事情 来 改变 这 种 境况 。 
通过 编写 自己 的 软件 ， 他 们 一 直 在 为 维护 电脑 的 管理 权 而 战斗 着 。 他 们 建设 着 Linux。 





一 提 到 Linux， 许 多 人 都 会 说 到 “自由 ”， 但 我 不 认为 他 们 都 知道 "自由 "的 真正 涵义 。 “自由 "是 一 种 权力 ， 它 决定 你 的 计算 机 能 
做 什么 ， 同 时 ， 只 有 知道 计算 机 正在 做 什么 你 才能 够 拥有 这 种 “自由 "。“ 自 由 "是 指 一 台 没有 任何 秘密 的 计算 机 ， 你 可 以 从 它 那 
里 了 解 一 切 ， 只 要 你 用 心 的 去 寻找 。 


为 什么 使 用 命 合 行 


你 是 否 注意 到 ， 在 电影 中 一 个 “超级 黑客 " 坐 在 电脑 前 ， 从 不 摸 一 下 鼠标 ， 就 能 够 在 30 秒 内 侵入 到 超 安全 的 军事 计算 机 中 。 这 
是 因为 电影 制 片 人 意识 到 ， 作为 人 类 ， 我 们 应 该 本 能 地 知道 让 计算 机 圆满 完成 工作 的 唯一 途径 ， 是 用 键盘 来 操纵 计算 机 。 


现在 ， 大 多 数 的 计算 机 用 户 只 是 熟悉 图 形 用 户 界面 (GUI) ， 并 且 产 品 供应 商 和 此 领域 的 学 者 会 灌输 给 用 户 这 样 的 思想 ， 命 
合 行 界面 (CLI) 是 过 去 使 用 的 一 种 很 恐怖 的 未 西 。 这 就 很 不 幸 ， 因 为 一 个 好 的 命令 行 界面 ， 是 用 来 和 计算 机 进行 交流 沟通 
的 非常 有 效 的 方式 ， 正 像 人 类 社会 使 用 文字 互通 信息 一 样 。 人 们 说 , “图 形 用 户 界面 让 简单 的 任务 更 容易 完成 ， 而 命令 行 界面 
使 完成 复杂 的 任务 成 为 可 能 ”到 现在 这 句 话 仍然 很 正确 。 


因为 Linux 是 以 Unix 家 族 的 操作 系统 为 模型 写成 的 ， 所 以 它 分 享 了 Unix 丰富 的 命令 行 工 具 。 Unix 在 20 世 纪 80 年 代 初 显赫 
一 时 (虽然 ， 开 发 它 在 更 早 之 前 ) ， 结 果 ， 在 普通 地 使 用 图 形 界 面 之 前 ， 开发 了 一 种 广泛 的 命令 行 界面 。 事 实 上 ， 很 多 人 选择 
Linux (而 不 是 其 他 的 系统 ， 上 比如 说 Windows NT) 是 因为 其 强大 的 命令 行 界面 ， 可 以 使 “完成 复杂 的 任务 成 为 可 能 "”。 


这 本 书 讲 什么 
这 本 书 介绍 如 何 生 存在 Linux 命 合 行 的 世界 。 不 像 一 些 书 籍 仅 仅 涉及 一 个 程序 ， 上 比如 像 shell 程序 ，bash。 这 本 书 将 试 着 向 
你 传授 如 何 与 命令 行 界面 友好 相处 。 它 是 怎样 工作 的 ? 它 能 做 什么 ? 使 用 它 的 最 好 方法 是 什么 ? 


这 不 是 一 本 关于 Linux 系统 管理 的 书 。 然 而 任何 一 个 关于 命令 行 的 深入 讨论 ， 都 一 定 会 牵涉 到 系统 管理 方面 的 内 容 ， 这 本 书 
仅仅 提 到 一 点 儿 管 理 方 面 的 知识 。 但 是 这 本 书 为 读者 准备 好 了 学 习 更 多 内 容 的 坚实 基础 ， 半 竟 要 胜任 系统 管理 工作 也 需要 良 
好 的 命令 行使 用 基本 功 。 


这 本 书 是 围绕 Linux 而 写 的 。 许 多 书籍 ， 为 了 扩大 自身 的 影响 力 ， 会 包含 一 些 其 它 平 台 的 知识 ， 比如 Unix, MacOS X 等 。 
这 样 做 ， 很 多 内 容 只 能 比较 空 泛 的 去 讲 了 。 另 一 方面 ， 这 本 书 只 研究 了 当代 Linux 发 行 版 。 虽 然 ， 对 于 使 用 其 它 类 似 于 Unix 
系统 的 用 户 来 说 ， 书 中 95% 的 内 容 是 有 用 的 ， 但 这 本 书 主要 面向 的 对 象 是 现代 Linux 命令 行 用 户 。 


谁 应 该 读 这 本 书 


这 本 书 是 为 已 经 从 其 它 平台 移民 到 Linux 系统 的 新 手 而 写 的 。 最 有 可 能 ， 你 是 使 用 某 个 Windows 版 本 的 高 手 。 或 许 是 老板 
让 你 去 管理 一 个 Linux 服务 器 ， 或 许 你 只 是 一 个 桌面 用 户 ， 厌 众 了 系统 出 现 的 各 种 安全 防御 问题 ， 而 想 要 体验 一 下 Linux。 
很 好 ， 这 里 欢迎 你 们 ! 


不 过 一 般 来 说 ， 对 于 Linux 的 启蒙 教育 ， 没 有 捷径 可 下。 学 习 命令 行 富 于 挑战 性 ， 而 且 很 费 气 力 。 这 并 不 是 说 Linux 命 邻 行 
很 难 学 ， 而 是 它 的 知识 量 很 大 ， 不 容易 掌握 。Linux 操作 系统 ， 差不多 有 数 以 千 计 的 命令 可 供用 户 操作 。 由 此 可 见 ， 要 给 自 
己 提 个 醒 ， 命 令 行 可 不 是 轻 轻松 松 就 能 学 好 的 。 





另 一 方面 ， 学 习 Linux 命令 行 会 让 你 受益 菲 浅 ， 给 你 极 大 的 回报 。 如 果 你 认为 ， 现在 你 已 经 是 一 个 高 手 了 。 别 急 ， 其 实 你 还 
不 知道 什么 才 是 真正 的 高 手 。 不 像 其 他 一 些 计算 机 技能 ， 一 段 时 间 之 后 可 能 就 被 淘汰 了 ， 命 令 行 知识 却 不 会 落伍 ， 你 今天 所 
学 到 的 ， 在 十 年 以 后 ， 都 会 有 用 处 。 命 合 行 通过 了 时 间 的 检验 。 


如 果 你 没有 编程 经 验 ， 也 不 要 担心 ， 我 会 带 你 入 门 。 
这 本 书 的 内 容 


这 些 材料 是 经 过 精心 安排 的 ， 很 像 一 位 老病 坐 在 你 身 旁 ， 耐 心地 指导 你 。 许多 作者 用 系统 化 的 方式 讲解 这 些 材 料 ， 虽 然 从 一 
个 作者 的 角度 考虑 很 有 道理 ， 但 对 于 Linux 新 手 来 说 ， 他 们 可 能 会 感到 非常 困惑 。 


另 一 个 目的 ， 是 想 让 读者 熟悉 Unix 的 思维 方式 ， 这 种 思维 方式 不 同 于 Windows 的 。 在 学 习 过 程 中 ， 我 们 会 帮助 你 理解 为 什 
么 某 些 命令 会 按照 它们 的 方式 工作 ， 以 及 它们 是 怎样 实现 那样 的 工作 方式 的 。 Linux 不 仅 是 一 款 软 件 ， 也 是 Unix 文化 的 一 小 
部 分 ， 它 有 自己 的 语言 和 历史 渊源 。 同时 ， 我 也 许 会 说 些 过 激 的 话 。 


这 本 书 共 分 为 五 部 分 ， 每 一 部 分 讲述 了 不 同方 面 的 命令 行 知 识 。 除 了 第 一 部 分 ， 也 就 是 你 正在 阅读 的 这 一 部 分 ， 这 本 书 还 包 
括 : 


e 第 二 部 分 一 学 习 shell 开始 探究 命令 行 基本 语言 ， 包 括 命令 组 成 结构 ， 文件 系统 浏览 ， 编 写 命 令 行 ， 查 找 命令 帮助 文 
档 。 


三 部 分 一 配置 文件 及 环境 讲述 了 如 何 编写 配置 文件 ， 通 过 配置 文件 ， 用 命令 行 来 操控 计算 机 。 
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部 分 一 常见 任务 及 主要 工具 探究 了 许多 命令 行经 常 执行 的 普通 任务 。 类 似 于 Unix 的 操作 系统 ， 例 如 Linux, 包括 许 
典 的 命令 行程 序 ， 这 些 程序 可 以 用 来 对 数据 进行 强大 的 操作 。 


. 
凡 识 让 
国 


泡 





分 一 编写 Shell 脚本 介绍 了 shell 编程 ， 一 个 无 可 否认 的 基本 技能 ， 能 够 自动 化 许多 常见 的 计算 任务 ， 很 容易 
。 通 过 学 习 shell 编程 ， 你 会 逐渐 熟悉 一 些 关 于 编程 语言 方面 的 概念 ， 这 些 概念 也 适用 于 其 他 的 编程 语言 。 
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怎样 阅读 这 本 书 

从 头 到 尾 的 阅读 。 它 并 不 是 一 本 技术 参考 手册 ， 实 际 上 它 更 像 一 本 故事 书 ， 有 开头 ， 过 程 ， 结 尾 。 

前 提 条 件 

为 了 使 用 这 本 书 ， 你 需要 安装 Linux 操作 系统 。 你 可 以 通过 两 种 方式 ， 来 完成 安装 。 

1. 在 一 台 (不 用 很 新 ) 的 电脑 上 安装 Linux。 你 选择 哪个 Linux 发 行 版 安装 ， 是 无 关 紧 要 的 事 。 虽然 大 多 数 人 一 开始 选择 
安装 Ubuntu, Fedora, 或 者 OpenSUSE。 如 果 你 拿 不 定 主意 ， 那 就 先 试 试 Ubuntu。 由 于 主机 硬件 配置 不 同 ， 安 装 
Linux 时 ， 你 可 能 不 费 吹 厌 之 力 就 装 上 了 ， 也 可 能 费 了 九 牛 二 虎 之 力 还 装 不 上 。 所 以 我 建议 ， 一 台 使 用 了 几 年 的 台式 
机 ， 至 少 要 有 256M 的 内 存 ，6G 的 硬盘 可 用 空间 。 尽 可 能 避免 使 用 笔记 本 电脑 和 无 线 网 络 ， 在 Linux 环境 下 ， 它 们 经 


常 不 能 工作 。 


2. 使 用 “Live CD.” 许多 Linux 发 行 版 都 自 带 一 个 比较 酷 的 功能 ， 你 可 以 直接 从 系统 安装 盘 CDROM 中 运行 Linux， 而 不 必 
安装 Linux。 开 机 进入 BIOS 设置 界面 ， 更 改 引 导 项 ， 设 置 为 “从 CDROM 启动 ”。 





不 管 你 怎样 安装 Linux， 为 了 练习 书 中 介绍 的 知识 ， 你 需要 有 超级 用 户 管理 员 ) 权限 。 


当 你 在 自己 的 电脑 上 安装 了 Linux 系统 之 后 ， 就 开始 一 边 阅 读本 书 ， 一 边 练习 吧 。 本 书 大 部 分 内 容 都 可 以 自己 动手 练习 ， 坐 
下 来 ， 敲 入 命令 ， 体 验 一 下 吧 。 


为 什么 我 不 叫 它 “GNU/Linux” 


在 某 些 领域 ， 把 Linux 操作 系统 称 为 “GNU/Linux 操作 系统 "， 则 政治 立场 正确 。 但 “Linux" 的 问题 是 ， 没有 一 个 完 


正确 的 方式 能 命名 它 ， 因 为 它 是 由 许 许 多 多 ， 分 布 在 世界 各 地 的 贡献 者 们 ， 合 作 开发 而 成 的 。 从 技术 层面 讲 ，Linux 
只 是 操作 系统 的 内 核 名 字 ， 没 别 的 含义 。 当 然 内 核 非常 重要 ， 因 为 有 它 ， 操作 系统 才能 运行 起 来 ， 但 它 并 不 能 构成 一 
个 完备 的 操作 系统 。 


Richard Stallman 是 一 个 天 才 的 哲学 家 ， 自 由 软件 运动 创始 人 ， 自 由 软件 基金 会 创办 者 ， 他 创建 了 GNU 工程 ， 编写 
了 第 一 版 GNU C 编译 器 (gcc) ， 创 立 了 GNU 通用 公共 协议 (the GPL) 等 等 。 他 坚持 把 Linux 称 为 “GNU/Linux”， 
为 的 是 准确 地 反映 GNU 工程 对 Linux 操作 系统 的 贡献 。 然而 ， 尽 管 GNU 项 目 早 于 Linux 内 核 ， 项 目的 贡献 应 该 得 到 
极 高 的 赞誉 ， 但 是 把 GNU 用 在 Linux 名 字 里 ， 这 对 其 他 为 Linux 的 发 展 做 出 重大 贡献 的 程序 员 来 说 ， 就 不 公平 了 。 
而 且 ， 我 觉得 要 是 叫 也 要 叫 “Linux/GNU" 比较 准确 一 些 ， 因为 内 核 会 先 和 启动 ， 其 他 一 切 都 运行 在 内 核 之 上 。 





在 目前 流行 的 用 法 中 ，“Linux" 指 的 是 内 核 以 及 在 一 个 典型 的 Linux 发 行 版 中 所 包含 的 所 有 免费 及 开源 软件 ;也 就 是 
说 ， 整 个 Linux 生态 系统 ， 不 只 有 GNU 项 目 软件 。 在 操作 系统 商界 ， 好 像 喜欢 使 用 单个 词 的 名 字 ， 比如 说 DOS， 
Windows, MacOS, Solaris, Irix, AIX. 所 以 我 选择 用 流行 的 命名 规则 。 然 而 ， 如 果 你 喜欢 用 “GNU/Linux”， 当 你 读 这 本 
书 时 ， 可 以 在 脑子 里 搜索 并 替换 “Linux"。 我 不 介意 。 





拓展 阅读 
Wikipedia 网 站 上 有 些 介 绍 本 章 提 到 的 名 人 的 文章 ， 以 下 是 链接 地 址 : 


e http://en.wikipedia.org/wiki/Linux_Torvalds 
e http:/en.wikipedia.orgWwiki/Richard_Stallman 


介绍 自由 软件 基金 会 及 GNU 项 目的 网 站 和 文章 : 


e http://en.wikipedia.org/wiki/Free_Software_Foundation 
e http://www .fsf.org 
e http:/www.gnu.org 


Richard Stallman 用 了 大 量 的 文字 来 叙述 “GNU/Linux” 的 命名 问题 ， 可 以 浏览 以 下 网 页 : 


e http://www.gnu.org/gnu/why-gnu-linux.html 
e http:/www.gnu.org/gnu/gnu-linux-faq.html#tools 


什么 是 shell 


一 说 到 命令 行 ， 我 们 真正 指 的 是 shell。shell 就 是 一 个 程序 ， 它 接受 从 键盘 输入 的 命令 ， 然 后 把 命令 传递 给 操作 系统 去 执 
行 。 几 乎 所 有 的 Linux 发 行 版 都 提供 一 个 名 为 bash 的 程序 ， bash 是 shell 的 一 种 ， 来 自 于 GNU 项 目 。“bash" 是 “Bourne 
Again SHell" 的 首 字 母 缩 写 ， 所 指 的 是 这 样 一 个 事实 ，bash 是 sh 的 增强 版 ，sh 是 最 初 Unix 的 shell 程序 ， 由 Steve 
Bourne 写成 。 


终端 仿真 器 
当 使 用 图 形 用 户 界面 时 ， 我 们 需要 另 一 个 叫做 终端 仿真 器 的 程序 ， 去 和 shell 交互 。 浏览 一 下 我 们 的 桌面 菜单 ， 我 们 可 能 会 
找到 一 个 。 虽 然 在 菜单 里 它 可 能 都 被 简单 地 称 为 "terminal"”， 但 是 KDE 用 的 是 konsole 程序 , 而 GNOME 则 使 用 gnome- 


terminal。 还 有 其 他 一 些 终端 仿真 器 可 供 Linux 使 用 ， 但 基本 上 ， 它 们 都 是 为 了 完成 同样 的 事情 ， 让 我 们 能 访问 shell。 也 
许 ， 你 会 喜欢 上 这 个 或 那个 终端 ， 由 于 它 所 附加 的 一 系列 花 从 功能 。 


第 一 次 按键 


好 ， 开 始 吧 。 启动 终端 仿真 器 ! 一 旦 它 运 行 起 来 ， 我 们 应 该 能 够 看 到 一 行 类 似 下 面 文字 的 输出 : 
[me@linuxbox ~]$ 


这 叫做 shell 提示 符 ， 当 shell 准备 好 了 去 接受 输入 时 ， 它 就 会 出 现 。 然 而 ， 它 可 能 会 以 各 种 各 样 的 面孔 显示 ， 这 则 取决 于 不 
同 的 Linux 发 行 版 ， 它 通常 包括 你 的 用 户 名 @ 主 机 名 ， 紧 接着 当前 工作 目录 〈 稍 后 会 有 更 多 介绍 ) 和 一 个 美元 符号 。 


如 果 提 示 符 的 最 后 一 个 字符 是 #”, 而 不 是 “$”, 那么 这 个 终端 会 话 就 有 超级 用 户 权 限 。 这 意味 着 ， 我 们 或 者 是 以 根 用 户 的 身份 
登录 ， 或 者 是 我 们 选择 的 终端 仿真 器 提供 超级 用 户 (管理 员 ) 权限 。 























假定 到 目前 为 止 ， 所 有 事情 都 进行 顺利 ， 那 我 们 试 着 打字 吧 。 在 提示 符 下 裔 入 一 些 乱 七 八 粳 的 无 用 数据 ， 如 下 所 示 : 





[me@linuxbox ~]$ kaekfjaeif] 


因为 这 个 命 合 没 有 任何 意义 ， 所 以 shell 会 提示 错误 信息 ， 并 让 我 们 再 试 一 下 : 


bash: kaekfjaeifj: command not found 
[me@linuxbox ~]$ 


命令 历史 


如 果 按 下 上 箭头 按键 ， 我 们 会 看 到 刚才 输入 的 命令 "kaekfjiaeifj" 重 新 出 现在 提示 符 之 后 。 这 就 叫做 命令 历史 。 许 多 Linux 发 行 
版 默认 保存 最 后 输入 的 500 个 命令 。 按 下 下 稍 头 按键 ， 先 前 输入 的 命令 就 消失 了 。 





移动 光标 


可 借助 上 箭头 按键 ， 来 获得 上 次 输入 的 命令。 现在 试 着 使 用 左右 箭头 按键 。 看 一 下 怎样 把 光标 定位 到 命令 行 的 任意 位 置 ? 通 
过 使 用 箭头 按键 ， 使 编辑 命令 变 得 轻松 些 。 


关于 鼠标 和 光标 


虽然 ，shell 是 和 键盘 打交道 的 ， 但 你 也 可 以 在 终端 仿真 器 里 使 用 鼠标 。X 窗口 系统 (使 GUI 工作 的 底层 引擎 ) 内 建 了 一 种 
机 制 ， 支 持 快速 拷贝 和 粘贴 技巧 。 如 果 你 想 高 亮 一 些 文本 ， 可 以 按 下 鼠标 左 键 ， 治 着 文本 拖 动 鼠标 (或 者 双击 一 个 单词 ) ， 
那么 这 些 高 亮 的 文本 就 被 拷贝 到 了 一 个 由 X 管理 的 缓冲 区 里 面 。 然 后 按 下 鼠标 中 键 ， 这 些 文本 就 被 粘贴 到 光标 所 在 的 位 置 。 
试 试看 。 





注意 : 不 要 在 一 个 终端 窗口 里 ， 使 用 Ctrl-c 和 Ctrl-v 快捷 键 ， 来 执行 拷贝 和 粘贴 操作 。 它们 不 起 作用 。 对 于 shell 来 说 ， 这 


些 控制 代码 有 着 不 同 的 含义 ， 它 们 被 赋值 ， 早 于 Microsoft Windows 许多 年 。 


你 的 图 形 桌 面 环 境 ( 像 KDE 或 GNOME) ， 努 力 想 和 Windows 一 样 ， 可 能 会 把 它 的 聚焦 策略 设置 成 “ 单 击 聚焦 "。 这 意味 
着 ， 为 了 让 窗口 聚焦 ( 变 得 活跃 ) 你 需要 单 击 它 。 这 与 “聚焦 跟随 着 鼠标 "的 传统 X 行为 不 同 ， 传 统 X 行为 是 指 只 要 把 鼠标 移 
动 到 一 个 窗口 的 上 方 ， 这 个 窗口 就 成 为 活动 窗口 。 这 个 窗口 不 会 成 为 前 端 窗口 ， 直 到 你 单 击 它 ， 但 它 能 接受 输入 。 设置 聚焦 
策略 为 聚焦 跟随 着 鼠标 "， 可 以 使 拷贝 和 粘贴 技巧 更 有 益 。 尝 试 一 下 。 给 它 一 个 机 会 ， 我 想 你 会 喜欢 上 它 的 。 在 窗口 管理 器 
的 配置 程序 中 ， 你 会 找到 这 个 设置 。 


试 试 运行 一 些 简单 命令 


现在 ， 我 们 学 习 了 怎样 输入 命令 ， 那 我 们 执行 一 些 简单 的 命令 吧 。 第 一 个 命令 是 date。 这 个 命令 显示 系统 当前 时 间 和 日 期 。 


[me@linuxbox ~]$ date 
MinUrOGL 2 DDAEDI2 O00 


一 个 相关 联 的 命 舍 ，cal， 它 默认 显示 当前 月 份 的 日 历 。 


[me@linuxbox ~]$ cal 
October 2007 

Su Mo Tu We Th Fr Sa 
2 

WhORONL ONATET 2 
TASTSELOMY LO.920. 
211022023524525320523 
28 29 30 31 


查看 磁盘 剩余 空间 的 数量 ， 输 入 df 





[me@linuxbox ~]$ df 


Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/sda2 15115452 5012392 9949716 34%/ 
/dev/sda5 59631908 26545424 30008432 47% /home 
/dev/sdal 147764 17370 122765 13% /boot 
tmpfs 256856 0 256856 0% /devshm 


同样 地 ， 显 示 空 闲 内 存 的 数量 ， 输 入 命令 free。 


[me@linuxbox ~]$ free 

total Used free shared buffers cached 
Mem: 2059676 846456 1213220 0 
44028 360568 

-/+ buffers/cache: 441860 1617816 

Swap: 1042428 0 1042428 


我 们 可 以 终止 一 个 终端 会 话 ， 通 过 关闭 终端 仿真 器 窗口 ， 或 者 是 在 shell 提示 符 下 输入 exit 命令 : 


[me@linuxbox ~]$ exit 


即使 ， 终 端 仿真 器 没有 运行 ， 几 个 终端 会 话 仍然 在 后 台 运 行 着 。 它 们 叫做 虚拟 终端 或 者 是 虚拟 控制 台 。 在 大 多 数 Linux 发 行 
版 中 ， 这 些 终端 会 话 都 可 以 访问 ， 按 下 Ctrl-Alt-F1 到 Ctrl-Alt-F6 访问 不 同 的 虚拟 终端 。 当 一 个 会 话 被 访问 的 时 候 ， 它 会 i 
示 登 录 提 示 框 ， 我 们 需要 输入 用 户 名 和 密码 。 从 一 个 虚拟 控制 台 转 换 到 另 一 个 ， 按 下 Alt 和 F1-F6。 返 回 图 形 桌 面 ， 按 下 Alt- 
a 


拓展 阅读 

e。 想 了 解 更 多 关于 Steve Bourne 的 故事 ，Bourne Shell 之 父 ， 读 一 下 这 篇 文章 : 
http://en.wikipedia.org/Wwiki/Steve_Bourne 

。 这 是 一 篇 关于 在 计算 机 领域 里 ，shells 概念 的 文章 : 


http://en.wikipedia.orgAwiki/Shell_(computing) 


文件 系统 中 跳 转 


我 们 需要 学 习 的 第 一 件 事 (除了 打字 之 外 ) 是 如 何在 Linux 文件 系统 中 跳 转 。 在 这 一 章节 中 ， 我 们 将 介绍 以 下 命令 : 


e pwd 一 打印 出 当前 工作 目录 名 





e cd 一 更改 目录 


e ls 一 列 出 目录 内 容 


理解 文件 系统 树 


类 似 于 Windows， 一 个 “类 Unix” 的 操作 系统 ， 比 如 说 Linux， 以 分 层 目录 结构 来 组 织 所 有 文件 。 这 就 意味 着 所 有 文件 组 成 
了 一 棵 树 型 目录 (有 时 候 在 其 它 系统 中 叫做 文件 夹 ) ， 这 个 目录 树 可 能 包含 文件 和 其 它 的 目录 。 文 件 系统 中 的 第 一 级 目录 称 
为 根 目 录 。 根 目录 包含 文件 和 子 目录 ， 子 目录 包含 更 多 的 文件 和 子 目录 ， 依 此 类 推 。 


不 同 于 Windows 的 是 ，Windows 每 个 存储 设备 都 有 一 个 独自 的 文件 系统 ， 类 似 于 Unix 的 操作 系统 ， 比如 Linux， 总 是 
一 个 单一 的 文件 系统 树 ， 不 管 有 多 少 个 磁盘 或 者 存储 设备 连接 到 计算 机 上 。 根据 系统 管理 员 的 兴致 ， 存 储 设 备 连接 到 (或 着 
更 精确 些 ， 是 挂 载 到 ) 目录 树 的 各 个 节点 上 。 系统 管理 员 负 责 维 扩 系 统 安 全 。 


当前 工作 目录 


i:. bshotts 
和 镶 人 i 
向 karen 
i “入 lost+found 


向 .enlightenment 
入.gnome 
* 入 .gnome- desktop 





图 1: 显示 在 文件 管理 器 中 的 系统 文件 树 


大 多 数 人 都 可 能 熟悉 图 形 文件 管理 器 ， 它 描述 了 文件 系统 树 的 结构 ， 正 如 图 1 所 示 。 注意 通常 ， 这 是 一 棵 倒置 的 树 ， 也 就 是 
说 ， 树 根 在 最 上 面 ， 而 各 个 枝 干 在 下 面 展开 。 


然而 ， 命 令 行 没有 图 片 ， 所 以 我 们 需要 考虑 用 不 同 的 方法 ， 在 文件 系统 树 中 跳 转 。 
把 文件 系统 想象 成 一 个 迷宫 形状 ， 就 像 一 棵 倒立 的 大 树 ， 我 们 站 在 迷宫 的 中 间 位 置 。 在 任意 时 刻 ， 我 们 处 于 一 个 目录 里 面 ， 


我 们 能 看 到 这 个 目录 包含 的 所 有 文件 ， 以 及 通 往 上 面目 录 ( 父 目录 ) 的 路 径 ， 和 下 面 的 各 个 子 目 录 。 我 们 所 在 的 目录 则 称 为 
当前 工作 目录 。 我 们 使 用 pwd (打印 工作 目录 ) 命令 ， 来 显示 当前 工作 目录 。 


[me@linuxbox ~]$ pwd 
/home/me 


当 我 首次 登录 系统 后 ， (或 者 馈 动 终端 仿真 器 会 话 后 ) ， 当 前 工作 目录 是 我 的 主 目 录 。 每 个 用 户 都 有 他 自己 的 主 目录 ， 当 用 
户 以 普通 用 户 的 身份 操控 系统 时 ， 主 目录 是 唯一 允许 用 户 编写 文件 的 地 方 。 


列 出 目录 内 容 


列 出 一 个 目录 包含 的 文件 及 子 目录 ， 使 用 Is 命令 。 


[me@linuxbox ~]$ ls 
Desktop Documents Music Pictures Public Templates Videos 





实际 上 ， 用 Is 命令 可 以 列 出 任 一 个 目录 的 内 容 ， 而 不 只 是 当前 工作 目录 的 内 容 。 ls 命令 还 能 完成 许多 有 趣 的 事情 。 在 下 一 章 
节 ， 我 们 将 介绍 更 多 关于 ls 的 知识 。 


更 改 当前 工作 目录 


要 更 改 工作 目录 (此 刻 ， 我 们 站 在 树 形 迷 富里 面 ) ， 我 们 用 cd 命 伟 。 输 入 cd, 然后 输入 你 想 要 的 工作 目录 的 路 径 名 ， 就 能 实 
现 愿望 。 路 径 名 就 是 治 着 目录 树 的 分 支 到 达 想 要 的 目录 ， 期 间 所 经 过 的 路 线 。 路 径 名 可 通过 两 种 方式 来 指定 ， 一 个 是 绝对 路 
径 ， 另 一 个 是 相对 路 径 。 首 先 处 理 绝对 路 径 。 





绝对 路 径 开始 于 根 目 录 ， 紧 跟着 目录 树 的 一 个 个 分 支 ， 一 直到 达 期 望 的 目录 或 文件 。 例如 ， 你 的 系统 中 有 一 个 目录 ， 大 多 数 
系统 程序 都 安装 在 这 个 目录 下 。 这 个 目录 的 路 径 名 是 /usrbin。 它 意味 着 从 根 目录 (用 开头 的 “/' 表 示 ) 开始 ， 有 一 个 叫 "Usr" 
的 目录 包含 了 目录 "bin"。 





[me@linuxbox ~]$ cd /usr/bin 
[me@linuxbox bin]$ pwd 
/usr/bin 

[me@linuxbox bin]$ ls 
.Listing of many, many files .… 


我 们 把 工作 目录 转 到 /usr/bin 目录 下 ， 里 面 装 满 了 文件 。 注 意 shell 提示 符 是 怎样 改变 的 。 为 了 方便 ， 通 常设 置 提示 符 自动 
显示 工作 目录 名 。 


相对 路 径 


绝对 路 径 从 根 目录 开始 ， 直 到 它 的 目的 地 ， 而 相对 路 径 开始 于 工作 目录 。 一 对 特殊 符号 来 表示 相对 位 置 ， 在 文件 系统 树 中 。 
这 对 特殊 符号 是 "(点 ) 和 "(点 点 )。 








符号 "" 指 的 是 工作 目录 ，"… 指 的 是 工作 目录 的 父 目录 。 下 面 的 例子 说 明 怎 样 使 用 它 。 再 次 更 改 工 作 目 录 到 /usr/bin : 


[me@linuxbox ~]$ cd /usr/bin 
[me@linuxbox bin]$ pwd 
/usr/bin 


好 的 ， 上 比方 说 更 改 工作 目录 到 /usr/bin 的 父 目录 /usr。 可 以 通过 两 种 方法 来 实现 。 或 者 使 用 绝对 路 径 名 : 


[me@linuxbox bin]$ cd /usr 
[me@linuxbox usr]$ pwd 
/usr 


或 者 ， 使 用 相对 路 径 : 


[me@linuxbox bin]$ cd .. 
[me@linuxbox usr]$ pwd 
/usr 


两 种 不 同 的 方法 ， 一 样 的 结果 。 我 们 应 该 选 哪 一 个 呢 ? 输入 量 最 少 的 那个 。 


同样 地 ， 从 目录 /usr 到 /usr/bin 也 有 两 种 途径 。 或 者 使 用 绝对 路 径 : 


[me@linuxbox usr]$ cd /usr/bin 
[me@linuxbox bin]$ pwd 
/usr/bin 


或 者 ， 用 相对 路 径 : 


[me@linuxbox usr]$ cd ./bin 
[me@linuxbox bin]$ pwd 
/usrbin 


有 一 件 很 重要 的 事 ， 我 必须 指出 来 。 在 几乎 所 有 的 情况 下 ， 你 可 以 省 略 "/"。 它 是 隐 含 地 。 输 入 : 


[me@linuxbox usr]$ cd bin 


实现 相同 的 效果 ， 如 果 不 指 定 一 个 文件 的 目录 ， 那 它 的 工作 目录 会 被 假定 为 当前 工作 目录 。 
有 用 的 快捷 键 
在 表 3-1 中 ， 列 举 出 了 一 些 快速 改变 当前 工作 目录 的 有 效 方法 。 


表 3-1: cd 快捷 键 





快捷 键 运行 结果 
cd 更 改 工作 目录 到 主 目录 。 
cd - 更 改 工作 目录 到 先前 的 工作 目录 。 
cd ~user_name 更 改 工作 目录 到 用 户主 目录 。 例 如 , cd ~bob 会 更 改 工作 目录 到 用 户 "bob"” 的 主 目录 。 
关于 文件 名 的 重要 规则 


1. 以 "" 字符 开头 的 文件 名 是 隐藏 文件 。 这 仅 表 示 ，|s 命令 不 能 列 出 它们 ， 除非 使 用 |s -a 命令 。 当 你 创建 帐号 后 ， 
几 个 配置 帐号 的 隐藏 文件 被 放置 在 你 的 主 目录 下 。 稍 后 ， 我 们 会 仔细 研究 一 些 降 藏 文件 ， 来 定制 你 的 系统 环境 。 
另外 ， 一 些 应 用 程序 也 会 把 它们 的 配置 文件 以 隐藏 文件 的 形式 放 在 你 的 主 目录 下 面 。 








2. 文件 名 和 命令 名 是 大 小 写 敏 感 的 。 文 件 名 File1 和 fle1 是 指 两 个 不 同 的 文件 名 。 


3. Linux 没有 "文件 扩展 名 "的 概念 ， 不 像 其 它 一些 系 统 。 可 以 用 你 喜欢 的 任何 名 字 来 给 文件 起 名 。 文 件 内 容 或 用 途 由 





其 它 方法 来 决定 。 虽 然 类 似 Unix 的 操作 系统 ， 不 用 文件 扩展 名 来 决定 文件 的 内 容 或 用 途 ， 但 是 应 用 程序 会 。 
4. 虽然 Linux 支持 长 文件 名 ， 文 件 名 可 能 包含 空格 ， 标 点 符号 ， 但 标点 符号 仅 限 使 用 “…,“ 一 "， 下 划 线 。 最 重要 的 


是 ， 不 要 在 文件 名 中 使 用 空格 。 如 果 你 想 表 示 词 与 词 间 的 空格 ， 用 下 划 线 字符 来 代替 。 过 些 时 候 ， 你 会 感激 自己 
这 样 做 。 


探究 操作 系统 


既然 我 们 已 经 知道 了 如 何在 文件 系统 中 跳 转 ， 是 时 候 开 始 Linux 操作 系统 之 旅 了 。 在 开始 之 前 ， 我 们 先 学 习 一 些 对 研究 


Linux 系统 有 帮助 的 命 邻 。 
e ls 一 列 出 目录 内 容 
e file 一 确定 文件 类 型 


e@ less 一 浏览 文件 内 容 


ls 乐趣 


有 充分 的 理由 证 明 ，|s 可 能 是 用 户 最 常 使 用 的 命令 。 通 过 它 ， 我 们 可 以 知道 目录 的 内 容 ， 以 及 各 种 各 祥 重 要 文件 和 目录 的 
性 。 正 如 我 们 所 知道 的 ， 只 简单 的 输入 Is 就 能 看 到 在 当前 目录 下 所 包含 的 文件 和 子 


[me@linuxbox ~]$ ls 
Desktop Documents Music Pictures Publica Templates Videos 





除了 当前 工作 目录 以 外 ， 也 可 以 列 出 指定 目录 的 内 容 ， 就 像 这 样 : 


me@linuxbox ~]$ ls /usr 
bin games kerberos libexec sbin src 
etc include lib local share tmp 





目录 列表 。 





甚至 可 以 列 出 多 个 指定 目录 的 内 容 。 在 这 个 例子 中 ， 将 会 列 出 用 户主 目录 (用 字符 ~" 代表) 和 /usr 目录 的 内 容 : 


[me@linuxbox ~]$ Is ~ /usr 
/home/me: 
Desktop Documents Music Pictures Public Templates Videos 


/usr: 
bin games kerberos libexec sbin src 
etc include lib local share tmp 


我 们 也 可 以 改变 输出 格式 ， 来 得 到 更 多 的 细节 : 


[me@linuxbox ~]$ 1s -| 

total 56 

drwxrwxr-x2 me me 4096 2007-10-26 17:20 Desktop 
drwxrwxr-x2 me me 4096 2007-10-26 17:20 Documents 
drwxrwxr-x2 me me 4096 2007-10-26 17:20 Music 
drwxrwxr-x2 me me 4096 2007-10-26 17:20 Pictures 
drwxrwxr-x2 me me 4096 2007-10-26 17:20 Public 
drwxrwxr-x2 me me 4096 2007-10-26 17:20 Templates 
drwxrwxr-x2 me me 4096 2007-10-26 17:20 Videos 


使 用 Is 命令 的 "选项 ， 则 结果 以 长 模式 输出 。 


选项 和 参数 


我 们 将 学 习 一 个 非常 重要 的 知识 点 ， 大 多 数 命 令 是 如 何 工作 的 。 命 令 名 经 常会 带 有 一 个 或 多 个 用 来 更 正 命令 行为 的 选项 ， 
进一步 ， 选 项 后 面 会 带 有 一 个 或 多 个 参数 ， 这 些 参数 是 命令 作用 的 对 象 。 所 以 大 多 数 命令 看 起 来 像 这 样 : 


command -options arguments 





更 


大 多 数 命令 使 用 的 选项 ， 是 由 一 个 中 划 线 加 上 一 个 字符 组 成 ， 例 如 ,，“-"， 但 是 许多 命令 ， 包 括 来 自 于 GNU 项 目的 命 售 ， 也 
支持 长 选项 ， 长 选项 由 两 个 中 划 线 加 上 一 个 字 组 成 。 当 然 ， 许多 命令 也 多 许 把 多 个 短 选 项 串 在 一 起 使 用 。 下 面 这 个 例子 ，Is 
命令 有 两 个 选项 ， “| 选项 产生 长 格式 输出 ，“t" 选 项 按 文件 修改 时 间 的 先后 来 排序 。 


[me@linuxbox ~]$ ls -lt 


加 上 长 选项 “--reverse”， 则 结果 会 以 相反 的 顺序 输出 : 


[me@linuxbox ~]$ ls -lt --reverse 


ls 命令 有 大 量 的 选项 。 表 4-1 列 出 了 最 常 使 用 的 选项 。 


表 4-1:1s 命令 选项 





选项 长 选项 描述 
-a --all 列 出 所 有 文件 ， 甚 至 包括 文件 名 以 圆 点 开头 的 隐藏 文件 。 
通常 ， 如 果 指定 了 目录 名 ，|s 命令 会 列 出 这 个 目录 中 的 内 容 ， 而 不 是 目录 本 身 。 
-d --directory | 选项 结合 使 用 ， 可 以 看 到 所 指定 目录 的 详细 信息 ， 而 不 是 目录 中 的 
下 人 例如 ， 如 果 名 字 是 目录 
-h --human-readable 以 长 格式 列 出 。 以 人 们 可 读 的 格式 ， 而 不 是 以 字 节 数 来 显示 文件 的 大 小 。 
-| 以 长 格式 显示 结果 。 
-r --reverse 以 相反 的 顺序 来 显示 结果 。 通 常 ，|s 命令 的 输出 结果 按照 字母 升序 排列 。 
-S 命令 输出 结果 按照 文件 大 小 来 排序 。 
-t 按照 修改 时 间 来 排序 。 


深入 研究 长 格式 输出 


正如 我 们 先前 知道 的 ，“-|" 选 项 导致 |s 的 输出 结果 以 长 格式 输出 。 这 种 格式 包含 大 量 的 有 用 信息 。 下 面 的 例子 目录 来 自 于 
Ubuntu 系统 : 


-rW-r--r-- 1 root root 98816 2007-04-03 11:05 oo-trig.xls 
1 root root 453764 2007-04-03 11:05 oo-welcome.odt 


1 root root 358374 2007-04-03 11:05 ubuntu Sax.0g9g 


-FW-r--r-- 


-rW-r--r-- 1 root root 3576296 2007-04-03 11:05 Experience ubuntu.ogg 
-rW-r--r-- 1 root root 1186219 2007-04-03 11:05 kubuntu-leaflet.png 
-rw-r--r-- 1 root root 47584 2007-04-03 11:05 logo-Edubuntu.png 
-rW-r--r-- 1 root root 44355 2007-04-03 11:05 logo-Kubuntu.png 
-rW-r--r-- 1 root root 34391 2007-04-03 11:05 logo-Ubuntu.png 
-rW-r--r-- 1 root root 32059 2007-04-03 11:05 oo-cd-cover.odf 
-rw-r--r-- 1 root root 159744 2007-04-03 11:05 oo-derivatives.doc 
-rw-r--r-- 1 root root 27837 2007-04-03 11:05 oo-maxwell.odt 

r 

r 

r 


-FW-r--r-- 


选 一 个 文件 ， 来 看 一 下 各 个 输出 字段 的 含义 : 
表 4-2:1s 长 格式 列表 的 字段 
字段 含义 


对 于 文件 的 访问 权限 。 第 一 个 字符 指明 文件 类 型 。 在 不 同类 型 之 间 ， 开头 的 “一 "说 明 是 一 个 普 
通 文 件 ，“d" 表 明 是 一 个 目录 。 其 后 三 个 字符 是 文件 所 有 者 的 访问 权限 ， 再 其 后 的 三 个 字符 是 


el 文件 所 属 组 中 成 员 的 访问 权限 ， 最 后 三 个 字符 是 其 他 所 有 人 的 访问 权限 。 这 个 字段 的 完整 含义 
将 在 第 十 章 讨论 。 
1 文件 的 硬 链接 数目 。 参 考 随后 讨论 的 关于 链接 的 内 容 。 


root 文件 属 主 的 用 户 名 。 


root 文件 所 属 用 户 组 的 名 字 。 
32059 以 字 节 数 表 示 的 文件 大 小 。 
2007-04-03 11:05 上 次 修改 文件 的 时 间 和 日 期 。 


oo-cd-cover.odf 文件 名 。 


确定 文件 类 型 
随 着 探究 操作 系统 的 进行 ， 知 道 文件 包含 的 内 容 是 很 有 用 的 。 我 们 将 用 file 命令 来 确定 文件 的 类 型 。 我 们 之 前 讨论 过 ， 在 


Linux 系统 中 ， 并 不 要 求 文件 名 来 反映 文件 的 内 容 。 然 而 ， 一 个 类 似 “picture.jpg” 的 文件 名 ， 我 们 会 期 望 它 包 含 JPEG 压缩 
图 像 ， 但 Linux 却 不 这 样 要 求 它 。 可 以 这 样 调用 file 命令 : 


file filename 
当 调 用 file 命令 后 ，file 命令 会 打印 出 文件 内 容 的 简单 描述 。 例 如 : 


[me@linuxbox ~]$ file picture.jpg 
picture.jpg: JPEG image data, JFIF standard 1.01 


有 许多 类 型 的 文件 。 事 实 上 ， 在 类 似 于 Unix 操作 系统 中 比如 说 Linux， 有 个 普通 的 观念 就 是 “任何 东西 都 是 一 个 文件 "。 随 着 
课程 的 进行 ， 我 们 将 会 明白 这 句 话 的 真 谤 。 

虽然 系统 中 许多 文件 格式 是 熟悉 的 ， 例 如 MP3 和 JPEG 文件 ， 但 也 有 一 些 文件 格式 比较 含 著 ， 极 少数 文件 相当 陌生 。 

用 less 浏览 文件 内 容 


less 命令 是 一 个 用 来 浏览 文本 文件 的 程序 。 纵 观 Linux 系统 ， 有 许多 人 类 可 读 的 文本 文件 。less 程序 为 我 们 检查 文本 文件 提 
供 了 方便 。 


什么 是 文本 ” 


在 计算 机 中 ， 有 许多 方法 可 以 表达 信息 。 所 有 的 方法 都 涉及 到 ， 在 信息 与 一 些 数字 之 间 确 立 一 种 关系 ， 而 这 些 数字 可 
以 用 来 表达 信息 。 半 竟 ， 计 算 机 只 能 理解 数字 ， 这 样 所 有 的 数据 都 被 转换 成 数值 表示 法 。 








有 些 数值 表达 法 非常 复 休 〈 例 如 压缩 的 视频 文件 ) ， 而 其 它 的 就 相当 简单 。 最 早 也 是 最 简单 的 一 种 表达 法 ， 叫 做 
ASCII 文本 。ASCII (发 音 是 "As-Key") 是 美国 信息 交换 标准 码 的 简称 。 这 是 一 个 简单 的 编码 方法 ， 它 首先 被 用 在 电 
传 打字 机 上 ， 用 来 实现 键盘 字符 到 数字 的 映射 。 





文本 是 简单 的 字符 与 数字 之 间 的 一 对 一 映射 。 它 非常 紧凑 。 五 十 个 字符 的 文本 翻译 成 五 十 个 字 节 的 数据 。 文 本 只 是 包 
含 简单 的 字符 到 数字 的 上 映射， 理解 这 点 很 重要 。 它 和 一 些 文字 义理 器 文档 不 一 样 ， 比 如 说 由 微软 和 OpenOffice.org 文 
档 编辑 器 创建 的 文件 。 这 些 文件 ， 和 简单 的 ASCI 文件 形成 鲜明 对 比 ， 它 们 包含 许多 非 文本 元 素 ， 来 描述 它 的 结构 和 
格式 。 普通 的 ASClI 文件 ， 只 包含 字符 本 身 ， 和 一 些 基 本 的 控制 符 ， 像 制 表 符 ， 回 车 符 及 换行 符 。 纵 观 Linux 系统 ， 
许多 文件 以 文本 格式 存储 ， 也 有 许多 Linux 工具 来 处 理 文本 文件 。 甚 至 Windows 也 承认 这 种 文件 格式 的 重要 性 。 著 
名 的 NOTEPAD.EXE 程序 就 是 一 个 ASCII 文本 文件 编辑 器 。 














为 什么 我 们 要 查看 文本 文件 呢 ? 因为 许多 包含 系统 设置 的 文件 〈 叫 做 配置 文件 ) ， 是 以 文本 格式 存储 的 ， 阅 读 它 们 可 以 更 深 
入 的 了 解 系统 是 如 何 工作 的 。 另 外 ， 许 多 系统 所 用 到 的 实际 程序 〈 叫 做 脚本 ) 也 是 以 这 种 格式 存储 的 。 在 随后 的 章节 里 ， 我 
们 将 要 学 习 怎 样 编辑 文本 文件 ， 为 的 是 修改 系统 设置 ， 还 要 学 习 编 写 自 己 的 脚本 文件 ， 但 现在 我 们 只 是 看 看 它们 的 内 容 而 
已 。 


less 命令 是 这 样 使 用 的 : 


less filename 


一 且 运 行 起 来 ，less 程序 允许 你 前 后 滚动 文件 。 例 如 ， 要 查看 一 个 定义 了 系统 中 全 部 用 户 身份 的 文件 ， 输 入 以 下 命令 : 


[me@linuxbox ~]$ less /etc/passwd 


一 旦 less 程序 运行 起 来 ， 我 们 就 能 浏览 文件 内 容 了 。 如 果 文 件 内 容 多 于 一 页 ， 那 么 我 们 可 以 上 下 滚动 文件 。 按 下 “q" 键 ， 退 
出 less 程序 。 


下 表 列 出 了 less 程序 最 常 使 用 的 键 喜 命令 。 


命令 行为 
Page UP orb 向 后 翻滚 一 页 
Page Down or space 向 前 翻动 一 页 
UP Arrow 向 前 移动 一 行 
Down Arrow 向 后 移动 一 行 
G 移动 到 最 后 一 行 
1Gorg 移动 到 开头 一 行 
/charaters 向 前 查找 指定 的 字符 串 
n 向 前 查找 下 一 个 出 现 的 字符 串 ， 这 个 字符 串 是 之 前 所 指定 查找 的 
h 显示 帮助 屏幕 
q 退出 less 程序 


less 就 是 more ( 禅 语 : 色即是空 ) 


less 程序 是 早期 Unix 程序 more 的 改进 版 。“less” 这 个 名 字 ， 对 习 语 “less is more” 开 了 个 玩笑 ， 这 个 习 语 是 现代 主义 建筑 
病 和 设计 者 的 座右铭 。 


less 属于 "页 面 调度 器 "程序 类 ， 这 些 程序 允许 通过 页 方式 ， 在 一 页 中 轻松 地 浏览 长 长 的 文本 文档 。 然 而 more 程序 只 能 向 前 分 
页 浏览 ， 而 less 程序 允许 前 后 分 页 浏览 ， 它 还 有 很 多 其 它 的 特性 。 


旅行 指南 
Linux 系统 中 ， 文 件 系统 布局 与 类 似 Unix 系统 的 文件 布局 很 相似 。 实 际 上 ， 一 个 已 经 发 布 的 标准 ， 叫做 Linux 文件 系统 层次 
标准 ， 详 细 说 明了 这 种 设计 模式 。 不 是 所 有 Linux 发 行 版 都 根据 这 个 标准 ， 但 大 多 数 都 是 。 


下 一 步 ， 我 们 将 在 文件 系统 中 游玩 ， 来 了 解 Linux 系统 的 工作 原理 。 这 会 给 你 一 个 温习 跳 转 命令 的 机 会 。 我 们 会 发 现 很 多 有 
趣 的 文件 都 是 普通 的 可 读 文本 。 将 开始 旅行 ， 做 做 以 下 练习 : 


1. cd 到 给 定 目录 

2. 列 出 目录 内 容 1s -| 

3. 如 果 看 到 一 个 有 趣 的 文件 ， 用 file 命令 确定 文件 内 容 
4. 如 果 文 件 看 起 来 像 文 本 ， 试 着 用 less 命令 浏览 它 


记得 复制 和 粘贴 技巧 ! 如 果 你 正在 使 用 鼠标 ， 双 击 文件 名 ， 来 复制 它 ， 然 后 按 下 鼠标 中 键 ， 粘 贴 文件 名 到 命令 行 中 。 


在 系统 中 游玩 时 ， 不 要 害怕 粘 花 惹 草 。 普 通用 户 是 很 难 把 东西 弄 乱 的 。 那 是 系统 管理 员 的 工作 ! 如 果 一 个 命令 抱怨 一 些 事 
情 ， 不 要 管 它 ， 尽 管 去 玩 别 的 东西 。 花 一 些 时 间 四 处 走 走 。 系统 是 我 们 自己 的 ， 尽 情 地 探究 吧 。 记 住 在 Linux 中 ， 没 有 秘密 
存在 ! 表 4-4 仅 仅 列 出 了 一 些 我 们 可 以 浏览 的 目录 。 闲 暇 时 试 试看 ! 





表 4-4: Linux 系统 中 的 目录 


目录 


/boot 


/dev 


/etc 


/home 


llib 


/lost+found 


/media 
/mnt 
/opt 
/proc 
/root 
/sbin 
/tmp 


/USr 
/usrbin 


/usr/lib 


/usr/local 


/usr/sbin 


/usr/share 


/usr/share/doc 


评论 

根 目录 ， 万 物 起 源 。 

包含 系统 启动 和 运行 所 必须 的 二 进 制程 序 。 

包含 Linux 内 核 ， 最 初 的 RMA 磁盘 映像 〈 系 统 和 启动 时 ， 由 驱动 程序 所 需 ) ， 和 和 启动 加 载 程序 。 
有 趣 的 文件 : 


e。 /boot/grub/grub.conf or menu.lst， 被 用 来 配置 启动 加 载 程 序 。 
e。 /bootNmlinuz，Linux 内 核 。 








这 是 一 个 包含 设备 结 点 的 特殊 目录 。"“ 一 切 都 是 文件 "， 也 适用 于 设备 。 在 这 个 目录 里 ， 内 核 维护 着 
它 支持 的 设备 。 


这 个 目录 包含 所 有 系统 层面 的 配置 文件 。 它 也 包含 一 系列 的 shell 脚本 ， 在 系统 启动 时 ， 这 些 脚本 
会 运行 每 个 系统 服务 。 这 个 目录 中 的 任何 文件 应 该 是 可 读 的 文本 文件 。 








有 意思 的 文件 : 虽然 /etc 目录 中 的 任何 文件 都 有 趣 ， 但 这 里 只 列 出 了 一 些 我 一 直 喜欢 的 文件 : 


e /etc/crontab， 定义 自动 运行 的 任务 。 
e@ /etc/fstab， 和 包含 存储 设 各 的 列表 ， 以 及 与 他 们 相关 的 挂 载 点 。 
e。 /etc/passwd， 和 包含 用 户 帐号 列表 。 





在 通常 的 配置 环境 下 ， 系 统 会 在 /home 下 ， 给 每 个 用 户 分 配 一 个 目录 。 普 通 只 能 在 他 们 自己 的 目录 
下 创建 文件 。 这 个 限制 保护 系统 免 受 错误 的 用 户 活动 破坏 。 


包含 核心 系统 程序 所 需 的 库 文 件 。 这 些 文件 与 Windows 中 的 动态 链接 库 相 似 。 

每 个 使 用 Linux 文件 系统 的 格式 化 分 区 或 设备 ， 例 如 ext3 文 件 系统 ， 都 会 有 这 个 目录 。 当 部 分 恢复 
一 个 损坏 的 文件 系统 时 ， 会 用 到 这 个 目录 。 除 非 文件 系统 真正 的 损坏 了 ， 那 么 这 个 目录 会 是 个 空 目 
录 。 


在 现在 的 Linux 系统 中 ，/media 目录 会 包含 可 移 除 媒体 设备 的 挂 载 点 ， 例如 USB 驱动 器 ，CD- 
ROMSs 等 等 。 这 些 设 各 连接 到 计算 机 之 后 ， 会 自动 地 挂 载 到 这 个 目录 结 点 下 。 


在 早 些 的 Linux 系统 中 ，/mnt 目录 包含 可 移 除 设备 的 挂 载 点 。 

这 个 /opt 目录 被 用 来 安装 “可 选 的 "软件 。 这 个 主要 用 来 存储 可 能 安装 在 系统 中 的 商业 软件 产品 。 
这 个 /proc 目录 很 特殊 。 从 存储 在 硬盘 上 的 文件 的 意义 上 说 ， 它 不 是 真正 的 文件 系统 。 反而 ， 它 是 
一 个 由 Linux 内 核 维护 的 虚拟 文件 系统 。 它 所 包含 的 文件 是 内 核 的 帘 视 孔 。 这 些 文件 是 可 读 的 ， 它 
们 会 告诉 你 内 核 是 怎样 监管 计算 机 的 。 

root 帐户 的 主 目录 。 

这 个 目录 包含 系统" 二进制 文件 。 它 们 是 完成 重大 系统 任务 的 程序 ， 通 常 为 超级 用 户 保留 。 
这 个 /tmp 目录 ， 是 用 来 存储 由 各 种 程序 创建 的 临时 文件 的 地 方 。 一 些 配 置 ， 导 致 系统 每 次 重新 启动 


时 ， 都 会 清空 这 个 目录 。 

在 Linux 系统 中 ，/usr 目录 可 能 是 最 大 的 一 个 。 它 包含 普通 用 户 所 需要 的 所 有 程序 和 文件 。 

/usrbin 目录 包含 系统 安装 的 可 执行 程序 。 通 常 ， 这 个 目录 会 包含 许多 程序 。 

包含 由 /usrbin 目录 中 的 程序 所 用 的 共享 库 。 

这 个 /usr/local 目录 ， 是 非 系统 发 行 版 自 带 ， 却 打算 让 系统 使 用 的 程序 的 安装 目录 。 通常 ， 由 源码 编 
译 的 程序 会 安装 在 /usr/local/bin 目录 下 。 新 安装 的 Linux 系统 中 ， 会 存在 这 个 目录 ， 但 却 是 空 目 
录 ， 直 到 系统 管理 员 放 些 示 西 到 它 里 面 。 

包含 许多 系统 管理 程序 。 


/usr/share 目录 包含 许多 由 /usr/bin 目录 中 的 程序 使 用 的 共享 数据 。 其 中 包括 像 默认 的 配置 文件 ， 
标 ， 桌 面 背 景 ， 音 频 文件 等 等 。 


大 多 数 安装 在 系统 中 的 软件 包 会 包含 一 些 文档 。 在 /usr/share/doc 目录 下 ， 我 们 可 以 找到 按照 软件 

包 分 类 的 文档 。 

除了 /tmp 和 /home 目录 之 外 ， 相 对 来 说 ， 目 前 我 们 看 到 的 目录 是 静态 的 ， 这 是 说 ， 它们 的 内 容 不 会 
ee 目录 是 可 能 需要 改动 的 文件 存储 的 地 方 。 各 种 数据 库 ， 假 脱 机 文件 ， 用 户 邮 件 等 等 ， 都 
驻扎 在 这 里 。 


这 个 varlog 目录 包含 日 志文 件 ， 各 种 系统 活动 的 记录 。 这 些 文件 非常 重要 ， 并 且 应 该 时 时 监测 它 



































Nvarllog 们 。 其 中 最 重要 的 一 个 文件 是 warlog/messages。 注 意 ， 为 了 系统 安全 ， 在 一 些 系统 中 ， 你 必须 是 
超级 用 户 才能 查看 这 些 日 志文 件 。 


符号 链接 


在 我 们 到 处 查看 时 ， 我 们 可 能 会 看 到 一 个 目录 ， 列 出 像 这 样 的 一 条 信息 : 
Irwxrwxrwx 1 root root 11 2007-08-11 07:34 libc.so.6 -> libc-2.6.so 


注意 看 ， 为 何 这 条 信息 第 一 个 字符 是 “"， 并 且 有 两 个 文件 名 呢 ? 这 是 一 个 特殊 文件 ， 叫 做 符号 链接 (也 称 为 软 链接 或 者 
symlink ) 。 在 大 多 数 " 类 Unix' 系统 中 ， 有 可 能 一 个 文件 被 多 个 文件 名 所 指向 。 虽 然 这 种 特性 的 意义 并 不 明显 ， 但 它 真 地 很 
有 用 。 


描绘 一 下 这 样 的 情景 : 一 个 程序 要 求 使 用 某 个 包含 在 名 为 “foo” 文 件 中 的 共享 资源 ， 但 是 “foo" 经 常 改变 版 本 号 。 这 样 ， 在 文件 
名 中 包含 版 本 号 ， 会 是 一 个 好 主意 ， 因 此 管理 员 或 者 其 它 相关 方 ， 会 知道 安装 了 哪个 "foo" 版 本 。 这 又 会 导致 一 个 问题 。 如 果 
我 们 更 改 了 共享 资源 的 名 字 ， 那 么 我 们 必须 跟踪 每 个 可 能 使 用 了 这 个 共享 资源 的 程序 ， 当 每 次 这 个 资源 的 新 版 本 被 安装 后 ， 
都 要 让 使 用 了 它 的 程序 去 寻找 新 的 资源 名 。 这 听 起 来 很 没 趣 。 





这 就 是 符号 链接 存在 至 今 的 原因 。 比 方 说 ， 我 们 安装 了 文件 "foo" 的 2.6 版 本 ， 它 的 文件 名 是 oo-2.6"， 然 后 创建 了 叫做 
“foo" 的 符号 链接 ， 这 个 符号 链接 指向 "foo-2.6"。 这 意味 着 ， 当 一 个 程序 打开 文件 "foo" 时 ， 它 实际 上 是 打开 文件 “foo-2.6"。 
现在 ， 每 个 人 都 很 高 兴 。 依 赖 于 “foo" 文件 的 程序 能 找到 这 个 文件 ， 并 且 我 们 能 知道 安装 了 哪个 文件 版 本 。 当 升 级 到 “foo- 
2.7” 版 本 的 时 候 ， 仅 添加 这 个 文件 到 文件 系统 中 ， 删 除 符号 链接 “foo”， 创建 一 个 指向 新 版 本 的 符号 链接 。 这 不 仅 解 决 了 版 本 
升级 问题 ， 而 且 还 允许 在 系统 中 保存 两 个 不 同 的 文件 版 本 。 假想 “foo-2.7” 有 个 错误 (该 死 的 开发 者 ! ) ， 那 我 们 得 回 到 原来 
的 版 本 。 一 样 的 操作 ， 我 们 只 需要 删除 指向 新 版 本 的 符号 链接 ， 然 后 创建 指向 旧版 本 的 符号 链接 就 可 以 了 。 


在 上 面 列 出 的 目录 (来 自 于 Fedora 的 /lib 目录 ) 展示 了 一 个 叫做 “libc.so.6” 的 符号 链接 ， 这 个 符号 链接 指向 一 个 叫做 “libc- 


2.6.so" 的 共享 库 文 件 。 这 意味 着 ， 寻 找 文件 qibc.so.6" 的 程序 ， 实 际 上 得 到 是 文件 “libc-2.6.s0”。 在 下 一 章节 ， 我 们 将 学 习 
如 何 建立 符号 链接 。 


硬 链 接 


讨论 到 链接 问题 ， 我 们 需要 提 一 下 ， 还 有 一 种 链接 类 型 ， 叫 做 硬 链接 。 硬 链接 同样 允许 文件 有 多 个 名 字 ， 但 是 硬 链 接 以 不 同 
的 方法 来 创建 多 个 文件 名 。 在 下 一 章 中 ， 我 们 会 谈 到 更 多 符号 链接 与 硬 链接 之 间 的 差异 问题 。 


拓展 阅读 
。 完整 的 Linux 文件 系统 层次 体系 标准 可 通过 以 下 链接 找到 : 


http:/www.pathname.comy/fhs/ 


操作 文件 和 目录 


此 时 此 刻 ， 我 们 已 经 准 各 好 了 做 些 真正 的 工作 ! 这 一 章节 将 会 介绍 以 下 命令 : 
e cp 一 复制 文件 和 目录 
e mv 一 移动 / 重 命名 文件 和 目录 
e。 mkdir 一 创建 目录 
e rm 一 删除 文件 和 目录 


。 In 一 创建 硬 链 接 和 符号 链接 





这 五 个 命令 属于 最 常 使 用 的 Linux 命令 之 列 。 它 们 用 来 操作 文件 和 目录 。 


现在 ， 坦 诚 地 说 ， 用 图 形 文件 管理 器 来 完成 一 些 由 这 些 命令 执行 的 任务 会 更 容易 些 。 使 用 文件 管理 器 ， 我 们 可 以 把 文件 从 一 
个 目录 拖 放 到 另 一 个 目录 ， 剪 贴 和 粘贴 文件 ， 删 除 文件 等 等 。 那 么 ， 为 什么 还 使 用 早期 的 命令 行程 序 呢 ? 








答案 是 命令 行程 序 ， 功 能 强大 有 灵活。 虽然 图 形 文件 管理 器 能 轻松 地 实现 简单 的 文件 操作 ， 但 是 对 于 复杂 的 文件 操作 任务 ， 则 
使 用 命 合 行 程序 比较 容易 完成 。 例 如 ， 怎 样 复制 一 个 目录 下 的 HTML 文件 到 另 一 个 目录 ， 但 这 些 HTML 文件 不 存在 于 目标 
目录 ， 或 者 是 文件 版 本 新 于 目标 目录 里 的 文件 ? 要 完成 这 个 任务 ， 使 用 文件 管理 器 相当 难 ， 使 用 命令 行 相 当 容 易 : 














cp -u*.html destination 


通配符 


在 开始 使 用 命令 之 前 ， 我 们 需要 介绍 一 个 使 命令 行 如 此 强大 的 shell 特性 。 因 为 shell 频繁 地 使 用 文件 名 ，shell 提供 了 特殊 
字符 来 帮助 你 快速 指定 一 组 文件 名 。 这 些 特殊 字符 叫做 通配符 。 使 用 通配符 (也 以 文件 名 代 换 著称 ) 允许 你 依据 字符 类 型 来 
选择 文件 名 。 下 表 列 出 这 些 通配符 以 及 它们 所 选择 的 对 象 : 


表 5 一 1 : 通配符 
通配符 意义 
匹配 任意 多 个 字符 (包括 需 个 或 一 个 ) 
? 匹配 任意 一 个 字符 (不 包括 规 个 ) 
[characters] 匹配 任意 一 个 属于 字符 集中 的 字符 
[Icharacters] 匹配 任意 一 个 不 是 字符 集中 的 字符 
[Eclass]] 匹配 任意 一 个 属于 指定 字符 类 中 的 字符 


表 5-2 列 出 了 最 常 使 用 的 字符 类 : 


表 5 一 2 : 普通 使 用 的 字符 类 


字符 类 意义 
[alnum:] 匹配 任意 一 个 字母 或 数字 
[alpha:] 匹配 任意 一 个 字母 
[digit] 匹配 任意 一 个 数字 
[lower'] 匹配 任意 一 个 小 写字 母 
[upper] 匹配 任意 一 个 大 写字 母 


借助 通配符 ， 为 文件 名 构建 非常 复杂 的 选择 标准 成 为 可 能 。 下 面 是 一 些 类 型 匹配 的 范例 : 


表 5 一 3 : 通配符 范例 


模式 匹配 对 象 


所 有 文件 

9 文件 名 以 "g" 开 头 的 文件 

b.txt 以 "b" 开 头 ， 中 间 有 替 个 或 任意 多 个 字符 ， 并 以 ".txt" 结 尾 的 文件 

Data??? 以 "Data" 开 头 ， 其 后 紧 接着 3 个 字符 的 文件 

[abc] 文件 名 以 "a","b", 或 "c" 开 头 的 文件 

BACKUP.[0-9][0-9][0-9] 以 "BACKUP." 开 头 ， 并 紧 接着 3 个 数字 的 文件 

[Cupper] 以 大 写字 母 开 头 的 文件 

号 digit 不 以 数字 开头 的 文件 

*[[:lower:]123] 文件 名 以 小 写字 母 结尾 ， 或 以 “1”，“2”"， 或 “3" 结尾 的 文件 
接受 文件 名 作为 参数 的 任何 命 售 ， 都 可 以 使 用 通配符 ， 我 们 会 在 第 八 章 更 深入 的 谈 到 这 个 知识 点 。 


字符 范围 





如 果 你 用 过 别 的 类 似 Unix 系统 的 操作 环境 ， 或 者 是 读 过 这 方面 的 书籍 ， 你 可 能 遇 到 过 [A-Z] 或 [a-z] 形 式 的 字符 范围 表 
示 法 。 这 些 都 是 传统 的 Unix 表示 法 ， 并 且 在 早期 的 Linux 版 本 中 仍 有 效 。 虽然 它们 仍然 起 作用 ， 但 是 你 必须 小 心地 
使 用 它们 ， 因 为 它们 不 会 产生 你 期 望 的 输出 结果 ， 除 非 你 合理 地 配置 它们 。 从 现在 开始 ， 你 应 该 避免 使 用 它们 ， 并 且 
用 字符 类 来 代替 它们 。 

















通配符 在 GUI 中 也 有 效 





NS 


通配符 非常 重要 ， 不 仅 因为 它们 经 常用 在 命令 行 中 ， 而 且 一 些 图 形 文件 管理 器 也 支持 它们 。 














e 在 Nautilus (GNOME 文件 管理 器 ) 中 ， 可 以 通过 Edit/Select 模式 菜单 项 来 选择 文件 。 输入 一 个 用 通配符 表示 的 
文件 选择 模式 后 ， 那 么 当前 所 浏览 的 目录 中 ， 所 匹配 的 文件 名 就 会 高 亮 显 示 。 




















e 在 Dolphin 和 Konqueror (KDE 文件 管理 器 ) 中 ， 可 以 在 地 址 栏 中 直接 输入 通配符 。 例 如 ， 如 果 你 想 查 看 目录 
/usrbin 中 ， 所 有 以 小 写字 母 "u" 开头 的 文件 ， 在 地 址 栏 中 融入 Wusrbin/u*"， 则 文件 管理 器 会 显示 匹配 的 结果 。 





最 初 源 于 命令 行 界面 中 的 想法 ， 在 图 形 界 面 中 也 适用 。 这 就 是 使 Linux 桌面 系统 如 此 强大 的 众多 原因 中 的 一 个 。 


mkdir 命令 是 用 来 创建 目录 的 。 它 这 样 工作 : 
mkdir directory... 


注意 表示 法 : 在 描述 一 个 命令 时 (如 上 所 示 ) ， 当 有 三 个 圆 点 跟 在 一 个 命令 的 参数 后 面 ， 这 意味 着 那个 参数 可 以 重复 ， 就 像 
这 样 : 


mkdir dir1 
会 创建 一 个 名 为 "dir1" 的 目录 ， 而 
mkdir dirl dir2 dir3 


会 创建 三 个 目录 ， 名 为 dir1, dir2, dir3。 


cp 一 复制 文件 和 目录 


cp 命令 ， 复 制 文件 或 者 目录 。 它 有 两 种 使 用 方法 : 


cp iteml item2 





复制 单个 文件 或 目录 "item1 "到 文件 或 目录 "item2"， 和 : 


cp item... directory 





复制 多 个 项 目 (文件 或 目录 ) 到 一 个 目录 下 。 


有 用 的 选项 和 实例 
这 里 列举 了 cp 命令 一 些 有 用 的 选项 ( 短 选 项 和 等 效 的 长 选项 ) 


表 5 一 4 : cp 选项 


选项 意义 
a 复制 文件 和 目录 ， 以 及 它们 的 属性 ， 包 括 所 有 权 和 权限 。 通常 ， 复 本 具有 用 户 所 操作 文 
件 的 默认 属性 。 
ertve 在 重 写 已 存在 文件 之 前 ， 提 示 用 户 确认 。 如 果 这 个 选项 不 指定 ， cp 命令 会 默认 重 写 文 
-mh --recursive 递归 地 复制 目录 及 目录 中 的 内 容 。 当 复制 目录 时 ， 需要 这 个 选项 (或 者 -a 选项 ) 。 
SR 当 把 文件 从 一 个 目录 复制 到 另 一 个 目录 时 ， 仅 复制 目标 目录 中 不 存在 的 文件 ， 或 者 是 文 
人 件 内 容 新 于 目标 目录 中 已 经 存在 的 文件 。 
-V, --Verbose 显示 翔实 的 命令 操作 信息 
表 5 一 5 : cp 实例 
命 倒 运行 结果 
cp file1 file2 复制 文件 filel 内 容 到 文件 他 e2。 如 果 file2 已 经 存在 ，file2 的 内 容 会 被 fle1 的 内 容重 
p 写 。 如 果 fle2 不 存在 ， 则 会 创建 fle2。 
这 条 命令 和 上 面 的 命令 一 样 ， 除 了 如 果 文 件 file2 存在 的 话 ， 在 文件 file2 被 重 写 之 前 ， 
Spe Nle2 会 提示 用 户 确认 信息 。 
cp file1 file2 dir1 复制 文件 fle1 和 文件 file2 到 目录 dirl。 目 录 dir1 必须 存在 。 
co dirip di 使 用 一 个 通配符 ， 在 目录 dir1 中 的 所 有 文件 都 被 复制 到 目录 dir2 中 。 dir2 必须 已 经 存 
p dir1/* dir2 在 
复制 目录 dir1 中 的 内 容 到 目录 dir2。 如 果 目 录 dir2 不 存在 ， 创建 目录 dir2， 操 作 完 成 
cp -r dir1 dir2 后 ， 目 录 dir2 中 的 内 容 和 dir1 中 的 一 样 。 如 果 目 录 dir2 存在 ， 则 目录 dir1( 和 目录 中 的 


内 容 ) 将 会 被 复制 到 dir2 中 。 


myv 一 移动 和 重 命名 文件 


myv 命令 可 以 执行 文件 移动 和 文件 命名 任务 ， 这 依赖 于 你 怎样 使 用 它 。 任 何 一 种 情况 下 ， 完 成 操作 之 后 ， 原 来 的 文件 名 不 再 
存在 。mv 使 用 方法 与 cp 很 相像 : 


mviteml item2 


把 文件 或 目录 “item1” 移动 或 重 命名 为 “item2", 或 者 : 


mv item.… directory 





把 一 个 或 多 个 条 目 从 一 个 目录 移动 到 另 一 个 目录 中 。 


有 用 的 选项 和 实例 


mv 与 cp 共享 了 很 多 一 样 的 选项 : 


选项 


i --interactive 


-U --update 


-V --Verbose 


mv file1 file2 


mv -ifile1 file2 
mv file1 file2 dir1 


mv dir1 dir2 


表 5 一 6 : mv 选项 
意义 


在 重 写 一 个 已 经 存在 的 文件 之 前 ， 提 示 用 户 确 认 信息 。 如 果 不 指 定 这 个 选项 ，myv 命 兮 
会 默认 重 写 文件 内 容 。 


当 把 文件 从 一 个 目录 移动 另 一 个 目录 时 ， 只 是 移动 不 存在 的 文件 ， 或 者 文件 内 容 新 于 目 
标 目录 相对 应 文件 的 内 容 。 


当 操 作 mv 命令 时 ， 显 示 翔 实 的 操作 信息 。 


表 5 一 7 mv 实例 


移动 filel 到 file2。 如 果 file2 存在 ， 它 的 内 容 会 被 file1 的 内 容重 写 。 如 果 fle2 不 存 
在 ， 则 创建 fle2。 每 种 情况 下 ，file1 不 再 存在 。 


除了 如 果 file2 存在 的 话 ， 在 file2 被 重 写 之 前 ， 用 户 会 得 到 提示 信息 外 ， 这 个 和 上 面 的 
选项 一 样 。 


移动 filel 和 file2 到 目录 dir1 中 。dir1l 必须 已 经 存在 。 


如 果 目 录 dir2 不 存在 ， 创 建 目录 dir2， 并 且 移动 目录 dir1 的 内 容 到 目录 dir2 中 ， 同 时 
| 除 目录 dir1。 如 果 目 录 dir2 存在 ， 移 动 目 录 dir1 (及 它 的 内 容 ) 到 目录 dir2。 





rm 命令 用 来 移 除 〈 删 除 ) 文件 和 目录 : 


rm item... 


"item" 代 表 一 个 或 多 个 文件 或 目录 。 


i, --interactive 


-r, --recursive 


-f, --force 


-V, --Verbose 


她 
中 


rm file1 
rm -ifile1 
rm -rfile1 dir1 


rm -rffile1 dir1 


小 心 rm/ 


表 5 一 8 : rm 选项 
义 


谢 


人 。 如 果 不 指定 这 个 选项 ，rm 会 默默 地 删除 文 
递归 地 删除 文件 ， 这 意味 着 ， 如 果 要 删除 一 个 目录 ， 而 此 目录 又 包含 子 目录 ， 那 么 子 目 
录 也 会 被 删除 。 要 删除 一 个 目录 ， 必 须 指定 这 个 选项 。 
忽视 不 存在 的 文件 ， 不 显示 提示 信息 。 这 选项 颠覆 了 "--interactive" 选 项 。 
在 执行 rm 命令 时 ， 显 示 翔 实 的 操作 信息 。 

表 5 一 9 : rm 实例 

运行 结果 

默默 地 删除 文件 
除了 在 删除 文件 之 前 ， 提 示 用 户 确认 信息 之 外 ， 和 上 面 的 命令 作用 一 样 。 
删除 文件 fle1, 目录 dirl1， 及 dir1 中 的 内 容 。 
同上 ， 除 了 如 果 文 件 fle1， 或 目录 dir1 不 存在 的 话 ，rm 仍 会 继续 执行 。 












































类 似 于 Unix 的 操作 系统 ， 比 如 说 Linux， 没 有 复原 命令 。 一 旦 你 用 rm 删除 了 一 些 未 西 ， 它 就 消失 了 。Linux 假定 你 


很 聪明 ， 你 知道 你 在 做 什么 。 




















尤其 要 小 心 通配符 。 思 考 一 下 这 个 经 典 的 例子 。 假 如 说 ， 你 只 想 删 除 一 个 目录 中 的 HTML 文件 。 输 入 : rm *.html 
这 是 正确 的 ， 如 果 你 不 小 心 在 "和 ".html" 之 间 多 输入 了 一 个 空格 ， 就 像 这 样 : 


这 个 rm 命 命 会 删除 目录 中 的 所 有 文件 ， 还 会 抱怨 没有 文件 叫做 ".html"。 











小 贴 士 。 无 论 什 么 时 候 ，rm 命 合用 到 通配符 (除了 仔细 检查 输入 的 内 容 外 ! ) ， 用 Is 命令 来 测试 通配符 。 这 会 让 你 
看 到 要 删除 的 文件 列表 。 然 后 按 下 上 箭头 按键 ， 重 新 调用 刚刚 执行 的 命 舍 ， 用 rm 替换 |s。 

















In 一 创建 链接 


In 命令 即 可 创建 硬 链接 ， 也 可 以 创建 符号 链接 。 可 以 用 其 中 一 种 方法 来 使 用 它 : 


In file link 


创建 硬 链接 ， 和 : 


In -s item link 


创建 符号 链接 ，"item" 可 以 是 一 个 文件 或 是 一 个 目录 。 


硬 链 接 


硬 链接 和 符号 链接 比 起 来 ， 硬 链接 是 最 初 Unix 创建 链接 的 方式 ， 而 符号 链接 更 加 现代 。 在 默认 情况 下 ， 每 个 文件 有 一 个 硬 
链接 ， 这 个 硬 链 接 给 文件 起 名 字 。 当 我 们 创建 一 个 硬 链接 以 后 ， 就 为 文件 创建 了 一 个 额外 的 目录 条 目 。 硬 链接 有 两 个 重要 局 
限 性 : 


1. 一 个 硬 链 接 不 能 关联 它 所 在 文件 系统 之 外 的 文件 。 这 是 说 一 个 链接 不 能 关联 与 链接 本 身 不 在 同一 个 磁盘 分 区 上 的 文件 。 
2. 一 个 硬 链接 不 能 关联 一 个 目录 。 

一 个 硬 链接 和 文件 本 身 没 有 什么 区 别 。 不 像 符 号 链接 ， 当 你 列 出 一 个 包含 硬 链 接 的 目录 内 容 时 ， 你 会 看 到 没有 特殊 的 链接 指 
示 说 明 。 当 一 个 硬 链接 被 删除 时 ， 这 个 链接 被 删除 ， 但 是 文件 本 身 的 内 容 仍然 存在 (这 是 说 ， 它 所 占 的 磁盘 空间 不 会 被 重新 


分 配 ) ， 直到 所 有 关联 这 个 文件 的 链接 都 删除 掉 。 知 道 硬 链接 很 重要 ， 因 为 你 可 能 有 时 会 遇 到 它们 ， 但 现在 实际 中 更 喜欢 使 
用 符号 链接 ， 下 一 步 我 们 会 讨论 符号 链接 。 


符号 链接 
创建 符号 链接 是 为 了 克服 硬 链接 的 局 限 性 。 符 号 链接 生效 ， 是 通过 创建 一 个 特殊 类 型 的 文件 ， 这 个 文件 包含 一 个 关联 文件 或 
目录 的 文本 指针 。 在 这 一 方面 ， 它们 和 Windows 的 快捷 方式 差不多 ， 当 然 ， 符 号 链接 早 于 Windows 的 快捷 方式 很 多 年 ;-) 





一 个 符号 链接 指向 一 个 文件 ， 而 且 这 个 符号 链接 本 身 与 其 它 的 符号 链接 几乎 没有 区 别 。 例如 ， 如 果 你 往 一 个 符号 链接 里 面 写 
入 东西 ， 那 么 相关 联 的 文件 也 被 写 和 信 。 然 而 ， 当 你 删除 一 个 符号 链接 时 ， 只 有 这 个 链接 被 删除 ， 而 不 是 文件 自身 。 如 果 删 除 
这 个 文件 早 于 文件 的 符号 链接 ， 这 个 链接 仍然 存在 ， 但 是 不 指向 任何 东西 。 在 这 种 情况 下 ， 这 个 链接 被 称 为 坏 链 接 。 在 许多 
实现 中 ，|s 命令 会 以 不 同 的 颜色 展示 坏 链接 ， 比 如 说 红色 ， 来 显示 它们 的 存在 。 

关于 链接 的 概念 ， 看 起 来 很 迷惑 ， 但 不 要 胆 导 。 我 们 将 要 试 着 练习 这 些 命 售 ， 希 望 ， 它 变 得 清晰 起 来 。 

创建 游戏 场 〈 实 战 演习 ) 


下 面 我 们 将 要 做 些 真 正 的 文件 操作 ， 让 我 们 先 建立 一 个 安全 地 带 ， 来 玩 一 下 文件 操作 命 人 。 首先 ， 我 们 需要 一 个 工作 目录 。 
在 我 们 的 主 目录 下 创建 一 个 叫做 "playground'" 的 目录 。 


创建 目录 





mkdir 命令 被 用 来 创建 目录 。 首 先 确 定 我 们 在 我 们 的 主 目录 下 ， 来 创建 playground 目录 ， 然后 创建 这 个 新 目录 : 


[me@linuxbox ~]$ cd 
[me@linuxbox ~]$ mkdir playground 





为 了 让 我 们 的 游戏 场 更 加 有 趣 ， 在 playground 目录 下 创建 一 对 目录 ， 分 别 叫 做 "dir1" 和 "dir2"。 更 改 我 们 的 当前 工作 目录 到 
playground， 然 后 执行 mkdir 命令 : 


[me@linuxbox ~]$ cd playground 
[me@linuxbox playground]$ mkdir dirl dir2 


注意 到 mkdir 命令 可 以 接受 多 个 参数 ， 它 允许 我 们 用 一 个 命令 来 创建 这 两 个 目录 。 


复制 文件 


下 一 步 ， 让 我 们 得 到 一 些 数 据 到 我 们 的 游戏 场 中 。 通 过 复制 一 个 文件 来 实现 目的 。 使 用 cp 命 舍 ， 我 们 从 /etc 目录 复制 
passwd 文件 到 当前 工作 目录 下 : 


[me@linuxbox playground]s$ cp /etc/passwd . 





注意 : 我 们 怎样 使 用 当前 工作 目录 的 快捷 方式 ， 命 令 末 尾 的 单个 圆 点 。 如 果 我 们 执行 |s 命令 ， 可 以 看 到 我 们 的 文件 : 


[me@linuxbox playground]$ ls -| 

total 12 

drwxrwxr-x2 me me 4096 2008-01-10 16:40 dirl 
drwxrwxr-x2 me me 4096 2008-01-10 16:40 dir2 
-rw-r--r-1 me me 1650 2008-01-10 16:07 passwd 


现在 ， 仅 仅 是 为 了 高 兴 ， 重 复 操作 复制 命 合 ， 使 用 "-v" 选 项 (只 明 ) ， 看 一 个 它 的 作用 : 


[me@linuxbox playground]$ cp -v /etc/passwd . 
/etc/passwd' -> . ./passwd' 





cp 命令 再 一 次 执行 了 复制 操作 ， 但 是 这 次 显示 了 一 条 简洁 的 信息 ， 指 明 它 进行 了 什么 操作 。 注 意 ，cp 没有 警告， 就 重 写 了 
第 一 次 复制 的 文件 。 这 是 一 个 案例 ， cp 假定 你 知道 你 的 所 作 所 为 。 为 了 得 到 警示 信息 ， 在 命令 中 包含 '-i" 选 项 : 


[me@linuxbox playground]$ cp -i /etc/passwd . 
cp: overwrite ` ./passwd'? 


响应 命令 提示 信息 ， 输 入 "y"， 文 件 就 会 被 重 写 ， 其 它 的 字符 (例如 ，"n") 会 导致 cp 命 合 不 理会 文件 。 


移动 和 重 命名 文件 


现在 ，"passwd" 这 个 名 字 ， 看 起 来 不 怎么 有 趣 ， 这 是 个 游戏 场 ， 所 以 我 们 给 它 改 个 名 字 : 


[me@linuxbox playground]$ mv passwd fun 





让 我 们 来 传送 fun 文件 ， 通 过 移动 重 命名 的 文件 到 各 个 子 目 录 ， 然后 再 把 它 移 回 到 当前 目录 : 


[me@linuxbox playground]$ mv fun dirl 


首先 ， 把 fun 文件 移动 目录 dirl 中 ， 然 后 : 


[me@linuxbox playground]$ mv dirl/fun dir2 





再 把 fun 文件 从 dirl 移 到 目录 dir2, 然后 : 


[me@linuxbox playground]$ mv dir2/fun . 


后 ， 再 把 fun 文件 带 回 到 当前 工作 目录 。 下 一 步 ， 来 看 看 移动 目录 的 效果 。 首先 ， 我 们 先 移动 我 们 的 数据 文件 到 dir1 目 


图 
取 
[me@linuxbox playground]$ mv fun dirl 


然后 移动 dirl 到 dir2 目录 ， 用 1s 来 确认 执行 结果 : 


[me@linuxbox playground]$ mv dirl dir2 
[me@linuxbox playground]j$ ls -| dir2 

total 4 

drwxrwxr-x 2 me me 4096 2008-01-11 06:06 dirl 
[me@linuxbox playground]$ ls -| dir2/dir1l 

total 4 

-rwW-r--r-- ] Me me 1650 2008-01-10 16:33 fun 


注意 : 因为 目录 dir2 已 经 存在 ，myv 命令 移动 dirl 到 dir2 目录 。 如 果 dir2 不 存在 ， mv 会 重新 命名 dir1 为 dir 2。 最 后 ， 把 
所 有 的 东西 放 回 原 你 。 


[me@linuxbox playground]$ mv dir2/dirl . 
[me@linuxbox playground]$ mv dirl/fun . 


创建 硬 链 接 


现在 ， 我 们 试 着 创建 链接 。 首 先是 硬 链 接 。 我 们 创建 一 些 关联 我 们 数据 文件 的 链接 : 


[me@linuxbox playground]s$ In fun fun-hard 
[me@linuxbox playground]$ In fun dirl/fun-hard 
[me@linuxbox playground]j$ In fun dir2/fun-hard 


所 以 现在 ， 我 们 有 四 个 文件 "fun" 的 实例 。 看 一 下 目录 playground 中 的 内 容 : 


[me@linuxbox playground]$ ls -| 

total 16 

drwxrwxr-x 2 me me 4096 2008-01-14 16:17 dirl 
drwxrwxr-x2 me me 4096 2008-01-14 16:17 dir2 
-rW-r--r-- 4 me me 1650 2008-01-10 16:33 fun 
-rW-r--r-- 4 me me 1650 2008-01-10 16:33 fun-hard 


注意 到 一 件 事 ， 列 表 中 ， 文 件 fun 和 fun-hard 的 第 二 个 字段 是 "4"， 这 个 数字 是 文件 "fun" 的 硬 链 接 数目 。 你 要 记得 一 个 文件 
至 少 有 一 个 硬 链接 ， 因 为 文件 名 就 是 由 链接 创建 的 。 所 以 ， 我 们 怎样 知道 实际 上 fun 和 fun-hard 是 一 样 的 文件 呢 ? 在 这 个 
例子 里 ，1s 不 是 很 有 用 。 虽然 我 们 能 够 看 到 fun 和 fun-hard 文件 大 小 一 样 (第 五 字段 ) ， 但 我 们 的 列表 没有 提供 可 靠 的 信息 
来 确定 (这 两 个 文件 一 样 ) 。 为 了 解决 这 个 问题 ， 我 们 更 深入 的 研究 一 下 。 


当 考 虑 到 硬 链接 ， 想 象 文件 是 由 两 部 分 组 成 : 数据 部 分 包含 文件 的 内 容 ， 名 字 部 分 包含 文件 的 名 字 ， 这 样 可 以 帮助 理解 。 当 
我 们 创建 了 文件 的 硬 链 接 ， 实际 上 ， 我 们 给 文件 添加 了 额外 的 名 字 ， 这 些 名 字 都 涉及 一 样 的 数据 内 容 。 系统 分 配 了 一 系列 的 





盘 块 给 所 谓 的 索引 节点 ， 它 和 文件 名 字 想 关联 。 因 此 每 个 硬 链接 都 关系 到 一 个 具体 的 索引 节点 ， 这 个 节点 包含 了 文件 的 内 
容 。 


ls 命令 有 一 种 方法 ， 来 展示 (文件 索引 节点 ) 的 信息 。 在 命令 中 加 上 "-i" 选 项 : 


[me@linuxbox playground]s$ ls -li 

total 16 

12353539 drwxrwxr-x2 me me 4096 2008-01-14 16:17 dirl 
12353540 drwxrwxr-x2 me me 4096 2008-01-14 16:17 dir2 
12353538 -rwW-r--r-- 4 me me 1650 2008-01-10 16:33 fun 
12353538 -rw-r--r-- 4 me me 1650 2008-01-10 16:33 fun-hard 


在 这 个 版 本 的 列表 中 ， 第 一 字段 表示 文件 索引 节点 号 ， 正 如 我 们 所 见 到 的 ，fun 和 fun-hard 共享 一 样 的 索引 节点 号 ， 这 就 证 
实 这 两 个 文件 是 一 样 的 文件 。 


创建 符号 链接 


建立 符号 链接 的 目的 是 为 了 克服 硬 链接 的 两 个 缺点 : 硬 链 接 不 能 跨越 物理 设备 ， 硬 链 接 不 能 关联 目录 ， 只 能 是 文件 。 符 号 链 
接 是 文件 的 特殊 类 型 ， 它 包含 一 个 指向 目标 文件 或 目录 的 文本 指针 。 





符号 链接 的 建立 过 程 相似 于 创建 硬 链接 : 


[me@linuxbox playground]j$ In -s fun fun-sym 
[me@linuxbox playground]j$ In -s ../fun dirl/fun-sym 
[me@linuxbox playground]$ In -s ../fun dir2/fun-sym 


第 一 个 实例 相当 直接 ， 在 In 命 命中， 简单 地 加 上 "-s" 选 项 就 可 以 创建 一 个 符号 链接 ， 而 不 是 一 个 硬 链 接 。 下 面 两 个 例子 又 是 
怎样 呢 ? 记 住 ， 当 我 们 创建 一 个 符号 链接 的 时 候 ， 会 建立 一 个 目标 文件 在 哪里 和 符号 链接 有 关联 的 文本 描述 。 如 果 我 们 看 看 
ls 命令 的 输出 结果 ， 比 较 容易 理解 。 


[me@linuxbox playground]j$ ls -| dir1 

total 4 

-rW-r--r-- 4 me me 1650 2008-01-10 16:33 fun-hard 
Irwxrwxrwx1me me 6 2008-01-15 15:17 fun-sym -> ../fun 





目录 dirl 中 ，fun-sym 的 列表 说 明了 它 是 一 个 符号 链接 ， 通 过 在 第 一 字段 中 的 首 字 符 "" 可 知 ， 并 且 它 还 指向 "../fun"， 也 是 正 
确 的 。 相 对 于 fun-sym 的 存储 位 置 ，fun 在 它 的 上 一 个 目录 。 同 时 注意 ， 符 号 链接 文件 的 长 度 是 6， 这 是 字符 串 "../fun" 所 包含 
的 字符 数 ， 而 不 是 符号 链接 所 指向 的 文件 长 度 。 


当 建立 符号 链接 时 ， 你 即 可 以 使 用 绝对 路 径 名 : 


In -s /home/me/playground/fun dirl/fun-sym 


也 可 用 相对 路 径 名 ， 正 如 前 面 例题 所 展示 的 。 使 用 相对 路 径 名 更 伟人 满意 ， 因为 它 人 允许 一 个 包含 符号 链接 的 目录 重 命名 或 移 
动 ， 而 不 会 破坏 链接 。 





除了 普通 文件 ， 符 号 链接 也 能 关联 目录 : 


[me@linuxbox playground]$ In -s dirl dirl-sym 
[me@linuxbox playground]$ ls -I 

total 16 

… 省 略 


移动 文件 和 目录 


正如 我 们 之 前 讨论 的 ，rm 命令 被 用 来 删除 文件 和 目录 。 我 们 将 要 使 用 它 来 清理 一 下 我 们 的 游戏 场 。 首 先 ， 删 除 一 个 硬 链 
接 : 


[me@linuxbox playground]s$ rm fun-hard 
[me@linuxbox playground]$ ls -| 

total 12 

.… 省 上 略 


结果 不 出 所 料 。 文 件 fun-hard 消失 了 ， 文 件 fun 的 链接 数 从 4 减 到 3， 正 如 目录 列表 第 二 字段 所 示 。 下 一 步 ， 我 们 会 删除 文 
件 fun， 仅 为 了 娱乐 ， 我 们 会 包含 "-i" 选项 ， 看 一 个 它 的 作用 : 


[me@linuxbox playground]s$ rm -i fun 
rm: remove regular file ‘fun’? 


在 提示 符 下 输入 "y"， 删 除 文件 。 让 我 们 看 一 下 Is 的 输出 结果 。 注 意 ，fun-sym 发 生 了 什么 事 ? 因为 它 是 一 个 符号 链接 ， 指 向 
已 经 不 存在 的 文件 ， 链 接 已 经 坏 了 : 


[me@linuxbox playground]$ ls -| 

total 8 

drwxrwxr-x2 me me 4096 2008-01-15 15:17 dirl 
Irwxrwxrwx 1 me me 4 2008-01-16 14:45 dirl-sym -> dirl 
drwxrwxr-x2 me me 4096 2008-01-15 15:17 dir2 
Irwxrwxrwx 1 me me 3 2008-01-15 15:15 fun-sym -> fun 


大 多 数 Linux 的 发 行 版 本 配置 |s 显示 损坏 的 链接 。 在 Fedora 系统 中 ， 坏 的 链接 以 闪烁 的 红色 文本 显示 ! 损坏 链接 的 出 现 ， 
并 不 危险 ， 但 是 相当 混乱 。 如 果 我 们 试 着 使 用 损坏 的 链接 ， 会 看 到 以 下 情况 : 


[me@linuxbox playground]j$ less fun-sym 
fun-sym: No such file or directory 


稍微 清理 一 下 现场 。 删 除 符号 链接 : 


[me@linuxbox playground]j$ rm fun-sym dirl-sym 
[me@linuxbox playground]$ ls -I 

total 8 

drwxrwxr-x2 me me 4096 2008-01-15 15:17 dirl 
drwxrwxr-x2 me me 4096 2008-01-15 15:17 dir2 


对 于 符号 链接 ， 有 一 点 值得 记 住 ， 执 行 的 大 多 数 文件 操作 是 针对 链接 的 对 象 ， 而 不 是 链接 本 身 。 而 rm 命令 是 个 特例 。 当 你 
删除 链接 的 时 候 ， 删 除 链接 本 身 ， 而 不 是 链接 的 对 象 。 





最 后 ， 我 们 将 删除 我 们 的 游戏 场 。 为 了 完成 这 个 工作 ， 我 们 将 返回 到 我 们 的 主 目录 ， 然 后 用 rm 命令 加 上 选项 (-D)， 来 删除 目 
录 playground， 和 目录 下 的 所 有 内 容 ， 包 括 子 目 录 : 


[me@linuxbox playground]s$ cd 
[me@linuxbox ~]$ rm -r playground 


用 GUI 来 创建 符号 链接 











文件 管理 器 GNOME 和 KDE 都 提供 了 一 个 简单 而 且 自 动 化 的 方法 来 创建 符号 链接 。 在 GNOME 里 面 ， 当 拖 动 文件 
时 ， 同 时 按 下 Ctrl+Shift 按键 会 创建 一 个 链接 ， 而 不 是 复制 〈 或 移动 ) 文件 。 在 KDE 中 ， 无 论 什么 时 候 放 下 一 个 文 
件 ， 会 弹出 一 个 小 菜单 ， 这 个 菜单 会 提供 复制 ， 移 动 ， 或 创建 链接 文件 选项 。 





总 结 


NA 


此 但 


在 这 一 章 中 ， 我 们 已 经 研究 了 许多 基础 知识 。 我 们 得 花费 一 些 时 间 来 全 面 的 理解 。 反复 练习 playground 例题 ， 直 到 你 觉得 
它 有 意义 。 能 够 良好 的 理解 基本 文件 操作 命 合 和 通配符 ， 非 常 重要 。 空 闪 时 ， 通 过 添加 文件 和 目录 来 拓展 playground 练 


习 ， 使 用 通配符 来 为 各 种 各 样 的 操作 命 全 指定 文件 。 关 于 链接 的 概念 ， 在 刚 开始 接触 时 会 觉得 有 点 迷惑 ， 花 些 时 间 来 学 习 它 
们 是 怎样 工作 的 。 它 们 能 成 为 真正 的 救星 。 





在 这 之 前 ， 我 们 已 经 知道 了 一 系列 神秘 的 命令 ， 每 个 命令 都 有 自己 奇妙 的 选项 和 参数 。 在 这 一 章 中 ， 我 们 将 试图 去 掉 一 些 神 
秘 性 ， 甚 至 创建 我 们 自己 的 命 伟 。 这 一 章 将 介绍 以 下 命令 : 


e type - 说 明 怎 样 解释 一 个 命令 

e Which 一 显示 会 执行 哪个 可 执行 程序 
e man 一 显示 命令 手册 页 

e apropos - 显示 一 系列 适合 的 命令 
e info - 显示 命令 info 

e。 whatis 一 显示 一 个 命令 的 简洁 描述 
e alias - 创建 命令 别名 

到 底 什 么 是 命令 ? 


命令 可 以 是 下 面 四 种 形式 之 一 : 





1. 是 一 个 可 执行 程序 ， 就 像 我 们 所 看 到 的 位 于 目录 /usrbin 中 的 文件 一 样 。 属于 这 一 类 的 程序 ， 可 以 编译 成 二 进 制 文件 ， 
诸如 用 C 和 C++ 语言 写成 的 程序 , 也 可 以 是 由 脚本 语言 写成 的 程序 ， 比 如 说 shell，perl，python，ruby， 等 等 。 


2. 是 一 个 内 建 于 shell 自身 的 命令 。bash 支持 若干 命令， 内 部 叫做 shell 内 部 命令 (builtins)。 例 如 ，cd 命令 ， 就 是 一 个 
shell 内 部 命 倒 。 


3. 是 一 个 shell 函数 。 这 些 是 小 规模 的 shell 脚本 ， 它 们 混合 到 环境 变量 中 。 在 后 续 的 章节 里 ， 我 们 将 讨论 配置 环境 变量 以 
及 书写 shell 函数 。 但 是 现在 ， 仅仅 意识 到 它们 的 存在 就 可 以 了 。 


4. 是 一 个 命令 别名 。 我 们 可 以 定义 自己 的 命令 ， 建 立 在 其 它 命令 之 上 。 

识别 命令 

这 经 常 很 有 用 ， 能 确切 地 知道 正在 使 用 四 类 命令 中 的 哪 一 类 。Linux 提供 了 一 对 方法 来 弄 明白 命 分 类 型 。 
type 一 显示 命令 的 类 型 


type 命令 是 shell 内 部 命令 ， 它 会 显示 命令 的 类 别 ， 给 出 一 个 特定 的 命 分 名 〈 做 为 参数 ) 。 它 像 这 样 工作 : 
type command 
"command "是 你 要 检测 的 命令 名 。 这 里 有 些 例子 : 


[me@linuxbox ~]$ type type 
type is a shell builtins 
[me@linuxbox ~]$ type ls 

ls is aliased to `1s --color=tty. 
[me@linuxbox ~]$ type cp 

cp is /bin/cp 


我 们 看 到 这 三 个 不 同 命令 的 检测 结果 。 注 意 ，ls 命令 (在 Fedora 系统 中 ) 的 检查 结果 ，ls 命令 实际 上 是 |s 命 合 加 上 选项 "-- 
color=tty" 的 别名 。 现 在 我 们 知道 为 什么 ls 的 输出 结果 是 有 颜色 的 ! 


which 一 显示 一 个 可 执行 程序 的 位 置 


有 时 候 在 一 个 操作 系统 中 ， 不 只 安装 了 可 执行 程序 的 一 个 版 本 。 然 而 在 桌面 系统 中 ， 这 并 不 普 青 ， 但 在 大 型 服务 器 中 ， 却 很 
平常 。 为 了 确定 所 给 定 的 执行 程序 的 准确 位 置 ， 使 用 which 命令 : 


[me@linuxbox ~]$ which ls 
/bin/ls 


这 个 命令 只 对 可 执行 程序 有 效 ， 不 包括 内 部 命令 和 命令 别名 ， 别 名 是 真正 的 可 执行 程序 的 替代 物 。 当 我 们 试 着 使 用 shell 内 
部 命令 时 ， 例 如 ，cd 命令 ， 我 们 或 者 得 不 到 回应 ， 或 者 是 个 错误 信息 : 


[me@linuxbox ~]$ which cd 

/usr/bin/which: no cd in 
(/opt/jre1.6.0_03/bin:/usr/lib/qt-3.3/bin:/usr/kerberos/bin:/opt/jrel 
.6.0_03/bin:/usr/lib/ccache:/usr/local/bin:/usr/bin:/bin:/home/me/bin) 


说 “命令 没有 找到 "， 真 是 很 奇特 。 

得 到 命令 文档 

知道 了 什么 是 命 舍 ， 现 在 我 们 来 寻找 每 一 类 命令 的 可 得 到 的 文档 。 
help 一 得 到 shell 内 部 命令 的 帮助 文档 


bash 有 一 个 内 建 的 帮助 工具 ， 可 供 每 一 个 shell 内 部 命令 使 用 。 输 入 "help"， 接 着 是 shell 内 部 命令 名 。 例 如 : 


[me@linuxbox ~]$ help cd 
cd: cd [-L|-P] [dir] 
Change .…. 


注意 表示 法 : 出 现在 命令 语法 说 明 中 的 方 括号 ， 表 示 可 选 的 项 目 。 一 个 坚 杠 字符 表示 互 斥 选项 。 在 上 面 cd 命令 的 例子 中 : 
cd [-LI-P] [dir] 


这 种 表示 法 说 明 ，cd 命 合 可 能 有 一 个 "-L" 选 项 或 者 "-P" 选 项 ， 进 一 步 ， 可 能 有 参数 "dir"。 


虽然 cd 命令 的 帮助 文档 很 简洁 准确 ， 但 它 决 不 是 教材 。 正 如 我 们 所 看 到 的 ， 它 似乎 提 到 了 许多 我 们 还 没有 谈论 到 的 东西 ! 
不 要 担心 ， 我 们 会 学 到 的 。 


--help 显示 用 法 信息 


许多 可 执行 程序 支持 一 个 "--help" 选 项 ， 这 个 选项 是 显示 命令 所 支持 的 语法 和 选项 说 明 。 例 如 : 


[me@linuxbox ~]$ mkdir --help 
Usage: mkdir [OPTION] DIRECTORY... 
Create .…. 


一 些 程序 不 支持 "--help" 选 项 ， 但 不 管 怎样 试 一 下 。 这 经 常会 导致 输出 错误 信息 ， 但 同时 能 揭示 一 样 的 命令 用 法 信息 。 





man 一 显示 程序 手册 页 


许多 希望 被 命令 行使 用 的 可 执行 程序 ， 提 供 了 一 个 正式 的 文档 ， 叫 做 手册 或 手册 页 (man page)。 一 个 特殊 的 叫做 man 的 分 
页 程序 ， 可 用 来 浏览 他 们 。 它 是 这 样 使 用 的 : 


man program 


"program'" 是 要 浏览 的 命 仿 名 。 
手册 文档 的 格式 有 点 不 同 ， 一 般 地 包含 一 个 标题 ， 命 令 语 法 的 纲要 ， 命 邻 用途 的 说 明 ， 和 命令 选项 列表 ， 及 每 个 选项 的 说 


明 。 然 而 ， 通 常 手 册 文 档 并 不 包含 实例 ， 它 打算 作为 一 本 参考 手册 ， 而 不 是 教材 。 作 为 一 个 例子 ， 浏 览 一 下 Is 命令 的 手册 文 
档 : 


[me@linuxbox ~]$ man ls 


在 大 多 数 Linux 系统 中 ，man 使 用 less 工具 来 显示 参考 手册 ， 所 以 当 浏 览 文 档 时 ， 你 所 熟悉 的 less 命令 都 能 有 效 。 


man 所 显示 的 参考 手册 ， 被 分 成 几 个 章节 ， 它 们 不 仅仅 包括 用 户 命 售 ， 也 包括 系统 管理 员 命令 ， 程 序 接口 ， 文 件 格式 等 等 。 
下 表 描 绘 了 手册 的 布局 : 


表 6-1: 手册 页 的 组 织 形式 


章节 内 容 
1 用 户 命令 
2 程序 接口 内 核 系统 调用 
3 C 库 画 数 程序 接口 
4 特殊 文件 ， 比 如 说 设备 结 点 和 驱动 程序 
5 文件 格式 
6 游戏 娱乐 ， 如 屏幕 保护 程序 
7 其 他 方面 
8 系统 管理 员 命 全 


有 时 候 ， 我 们 需要 查看 参考 手册 的 特定 章节 ， 从 而 找到 我 们 需要 的 信息 。 如 果 我 们 要 查找 一 种 文件 格式 ， 而 同时 它 也 是 一 个 
命令 名 时 ,这 种 情况 尤其 正确 。 没有 指定 章节 号 ， 我 们 总 是 得 到 第 一 个 匹配 项 ， 可 能 在 第 一 章节 。 我 们 这 样 使 用 man 命 今 ， 
来 指定 章节 号 : 


man section search_term 
例如 : 
[me@linuxbox ~]$ man 5 passwd 


命令 运行 结果 会 显示 文件 /etc/passwd 的 文件 格式 说 明 手 册 。 


apropos 一 显示 适当 的 命令 


也 有 可 能 搜索 参考 手册 列表 ， 基 于 某 个 关键 字 的 匹配 项 。 虽然 很 粗糙 但 有 时 很 有 用 。 下 面 是 一 个 以 "floppy 为 关键 词 来 搜索 
参考 手册 的 例子 : 


[me@linuxbox ~]$ apropos floppy 
create floppy_devices (8) - udev callout to create all possible 


输出 结果 每 行 的 第 一 个 字段 是 手册 页 的 名 字 ， 第 二 个 字段 展示 章节 。 注 意 ，man 命 全 加 上 "-k" 选 项 ， 和 apropos 完成 一 样 的 


whatis 一 显示 非常 简洁 的 命令 说 明 
whatis 程序 显示 匹配 特定 关键 字 的 手册 页 的 名 字 和 一 行 命令 说 明 : 


最 星 涩 难 懂 的 手册 页 


正如 我 们 所 看 到 的 ，Linux 和 类 似 于 Unix 的 系统 提供 的 手册 页 ， 只 是 打算 作为 参考 手册 使 用 ， 而 不 是 教材 。 许 多 手册 
因为 我 正在 为 这 本 书 做 我 的 研 


Rr 阅读 ， 但 是 我 认为 由 于 阅读 难度 而 能 拿 到 特等 奖 的 手册 页 应 该 是 bash 手册 页 。 
所 以 我 很 仔细 地 浏览 了 整个 bash 手册 ， 为 的 是 确保 我 讲述 了 大 部 分 的 bash 主题 
a 其 篇 幅 有 八 十 多 页 且 内 容 极 其 紧密 ， 但 对 于 初学 者 来 说 ， 其 结构 安排 毫 无 意义 。 











。 当 把 bash 参考 手册 整个 打印 











另 一 方面 ，bash 参考 手册 的 内 容 非 常 简 明 精 确 ， 同 时 也 非常 完善 。 所 以 ， 如 果 你 有 胆量 


就 查看 一 下 ， 


f 且 期 望 有 一 天 











你 能 读 懂 它 。 


info - 显示 程序 Info 条 目 








GNU 项 目 提供 了 一 个 命令 程序 手册 页 的 替代 物 ， 称 为 "info"。info 内 容 可 通过 info 阅读 器 程序 读 取 。info 页 是 超级 链接 形式 


的 ， 和 网 页 很 相似 。 这 有 个 例子 : 


File: coreutils.info, Node: ls invocation, Next: dir invocation， 
Up: Directory listing 


10.1 “ls': List directory contents 








info 程序 读 取 info 文件 ，info 文件 是 树 型 结构 ， 分 化 为 各 个 结 点 ， 每 一 个 包含 一 个 题目 。 info 文件 包含 超级 链接 ， 它 可 以 让 
你 从 一 个 结 点 跳 到 另 一 个 结 点 。 一 个 超级 链接 可 通过 它 开头 的 星 号 来 辨别 出 来 ， 把 光标 放 在 它 上 面 并 按 下 enter 键 ， 就 可 以 


激活 它 。 
输入 "info"， 接 着 输入 程序 名 称 ， 启 动 info。 下 表 中 的 命令 ， 当 显示 一 个 info 页 面 时 ， 用 来 


表 6 一 2 : info 命 兮 


命 命 行为 
? 显示 命令 帮助 
PgUp or Backspace 显示 上 一 页 
PgDn or Space 显示 下 一 页 
n 下 一 个 - 显示 下 一 个 结 点 
p 上 一 个 - 显示 上 一 个 结 点 
U Up - 显示 当前 所 显示 结 点 的 父 结 点 ， 通 常 是 个 菜单 
Enter 激活 光标 位 置 下 的 超级 链接 
9 退出 


到 目前 为 止 ， 我 们 所 讨论 的 大 多 数 命令 行程 序 ， 属 于 GNU 项 目 "coreutils" 包 ， 所 以 输入 : 
[me@linuxbox ~]$ info coreutils 


将 会 显示 一 个 包含 超级 链接 的 手册 页 ， 这 些 超 级 链接 指向 包含 在 coreutils 包 中 的 各 个 程序 。 


README 和 其 它 程序 文档 


控制 阅读 器 。 


许多 安装 在 你 系统 中 的 软件 ， 都 有 自己 的 文档 文件 ， 这 些 文件 位 于 /usrshare/doc 目录 下 。 这 些 文件 大 多 数 是 以 文本 文件 的 
形式 存储 的 ， 可 用 less 阅读 器 来 浏览 。 一 些 文件 是 HTML 格式 ， 可 用 网 页 浏览 器 来 阅读 。 我 们 可 能 遇 到 许多 以 ".gz" 结 尾 的 
文件 。 这 表示 gzip 压缩 程序 已 经 压缩 了 这 些 程序 。gzip 软件 包 包 括 一 个 特殊 的 less 版 本 ， 叫 做 zless，zless 可 以 显示 由 
gzip 压缩 的 文本 文件 的 内 容 。 


用 别名 (alias) 创建 你 自己 的 命令 


现在 是 时 候 ， 感 受 第 一 次 编程 经 历 了 ! 我 们 将 用 alias 命令 创建 我 们 自己 的 命 舍 。 但 在 开始 之 前 ， 我 们 需要 展示 一 个 命令 行 
小 技巧 。 可 以 把 多 个 命令 放 在 同一 行 上 ， 命 令 之 间 用 "," 分 开 。 它 像 这 样 工作 : 


command1l; command2; command3... 
我 们 会 用 到 下 面 的 例子 : 


[me@linuxbox ~]$ cd /usr; ls; cd - 
bin games kerberos lib64 local share tmp 


[ee pe ~]$ 


正如 我 们 看 到 的 ， 我 们 在 一 行 上 联合 了 三 个 命令 。 首 先 更 改 目录 到 /usr， 然 后 列 出 目录 内 容 ， 最 后 回 到 原始 目录 〈 用 命令 "cd 
~") ,结束 在 开始 的 地 方 。 现 在 ， 通 过 alia 命令 把 这 一 串 命令 转变 为 一 个 命令 。 我 们 要 做 的 第 一 件 事 就 是 为 我 们 的 新 命令 构想 
一 个 名 字 。 比方 说 "test'。 在 使 用 "test" 之 前 ， 查 明 是 否 "test'" 命 令 名 已 经 存在 系统 中 ， 是 个 很 不 错 的 主意 。 为 了 查 清 此 事 ， 可 
以 使 用 type 命令 : 





[me@linuxbox ~]$ type test 
test is a shell builtin 


哦 1 "test" 名 字 已 经 被 使 用 了 。 试 一 下 "foo" 


[me@linuxbox ~]$ type foo 
bash: type: foo: not found 


太 棒 了 ! "foo" 还 没 被 占用 。 创 建 命 合 别 名 : 


[me@linuxbox ~]$ alias foo='cd /usr; Is; cd -' 


<、 


= 
注意 命令 结构 : 
alias name='string' 


在 命令 "alias'" 之 后 ， 输 入 “name"， 紧 接着 (没有 空格 ) 是 一 个 等 号 ， 等 号 之 后 是 一 串 用 引号 引起 的 字符 串 ， 字 符 串 的 内 容 要 
赋值 给 name。 我 们 定义 了 别名 之 后 ， 这 个 命令 别名 可 以 使 用 在 任何 地 方 。 试 一 下 : 


[me@linuxbox ~]$ foo 
bin games kerberos lib64 local share tmp 


ee ~]$ 


我 们 也 可 以 使 用 type 命令 来 查看 我 们 的 别名 : 


[me@linuxbox ~]$ type foo 
foo is aliased to ‘cd /usr; ls; cd -' 


删除 别名 ， 使 用 unalias 命 舍 ， 像 这 样 : 


[me@linuxbox ~]$ unalias foo 
[me@linuxbox ~]$ type foo 
bash: type: foo: not found 


虽然 我 们 有 意 避 免 使 用 已 经 存在 的 命令 名 来 命名 我 们 的 别名 ， 但 这 是 常 做 的 事情 。 通 常 ， 会 把 一 个 普 表 用 到 的 选项 加 到 一 个 
经 常 使 用 的 命令 后 面 。 例 如 ， 之 前 见 到 的 ls 命令 ， 会 带 有 色彩 支持 : 


[me@linuxbox ~]$ type ls 
ls is aliased to 'ls --Color=tty' 


要 查看 所 有 定义 在 系统 环境 中 的 别名 ， 使 用 不 带 参 数 的 alias 命令 。 下 面 在 Fedora 系统 中 默认 定义 的 别名 。 试 着 弄 明白 ， 
它们 是 做 什么 的 : 


[me@linuxbox ~]$ alias 
alias |.='s -d .* --color=tty' 


在 命令 行 中 定义 别名 有 点 儿 小 问题 。 当 你 的 shell 会 话 结束 时 ， 它 们 会 消失 。 随 后 的 章节 里 ， 我 们 会 了 解 怎 样 把 自己 的 别名 
添加 到 文件 中 去 ， 每 次 我 们 登录 系统 ， 这 些 文件 会 建立 系统 环境 。 现在 ， 好 好 享受 我 们 刚 经 历 过 的 ， 步 入 shell 编程 世界 的 
第 一 步 吧 ， 虽 然 微 小 。 


拜访 老 朋 友 


既然 我 们 已 经 学 习 了 怎样 找到 命令 的 帮助 文档 ， 那 就 试 着 查阅 ， 到 目前 为 止 ， 我 们 学 到 的 所 有 命令 的 文档 。 学 习 命 令 其 它 可 
用 的 选项 ， 练 习 一 下 ! 


拓展 阅读 
e@ 在 网 上 ， 有 许多 关于 Linux 和 命令 行 的 文档 。 以 下 是 一 些 最 好 的 文档 : 


e。 Bash 参考 手册 是 一 本 bash shell 的 参考 指南 。 它 仍然 是 一 本 参考 书 ， 但 是 包含 了 很 多 实例 ， 而 且 它 比 bash 手册 页 容 
易 阅 读 。 


http:/www.gnu.org/software/bash/manual/bashref.html 


e Bash FAQ 包含 关于 bash， 而 经 常 提 到 的 问题 的 答案 。 这 个 列表 面向 bash 的 中 高 级 用 户 ， 但 它 包含 了 许多 有 帮助 的 信 


http://mywiki.wooledge.org/BashFAQ 


e GUN 项 目 为 它 的 程序 提供 了 大 量 的 文档 ， 这 些 文档 组 成 了 Linux 命令 行 实验 的 核心 。 这 里 你 可 以 看 到 一 个 完整 的 列 
表 : 


http:/www.gnu.org/manual/manual.html 
e Wikipedia 有 一 篇 关于 手册 页 的 有 趣 文章 : 


http://en.wikipedia.org/Wwiki/Man_page 


重 定向 


这 堂 课 ， 我 们 来 介绍 可 能 是 命令 行 最 酷 的 特性 。 它 叫做 I/O 重 定 向 。"I/O" 代 表 输 入 /输出 ， 通过 这 个 工具 ， 你 可 以 重 定向 命令 
的 输入 和 输出， 命令 的 输入 来 自 文 件 ， 而 输出 也 存 到 文件 。 也 可 以 把 多 个 命令 连接 起 来 组 成 一 个 强大 的 命令 管道 。 为 了 炫耀 这 
个 工具 ， 我 们 将 叙述 以 下 命令 : 

e cat 一 连接 文件 

e sort 一 排序 文本 行 

e unid 一 报道 或 省 略 重复 行 

e grep 一 打印 匹配 行 

e WC 一 打印 文件 中 换行 符 ， 字 ， 和 字 节 个 数 


e head 一 输出 文件 第 一 部 分 


。 tail - 输出 文件 最 后 一 部 分 


标准 输入 ， 输 出 ， 和 错误 
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到 目前 为 止 ， 我 们 用 到 的 许多 程序 都 会 产生 某 种 输出 。 这 种 输出 ， 经 常 由 两 种 类 型 组 成 。 第 一 ， 程 序 运行 结果 ; 这 是 说 ， 程 
序 要 完成 的 功能 。 第 二 ， 我 们 得 到 状态 和 错误 信息 ， 这 些 告诉 我 们 程序 进展 。 如 果 我 们 观察 一 个 命 售 ， 像 ls， 会 看 到 它 的 运 
行 结果 和 错误 信息 显示 在 屏幕 上 。 


与 Unix 主题 “任何 东西 都 是 一 个 文件 "保持 一 致 ， 程 序 ， 上 比方 说 ls， 实际 上 把 他 们 的 运行 结果 输送 到 一 个 叫做 标准 输出 的 特殊 
文件 (经 常用 stdout 表示 ) ， 而 它们 的 状态 信息 则 送 到 另 一 个 叫做 标准 错误 的 文件 (stderr) 。 默 认 情 况 下 ， 标 准 输出 和 标 
准 错误 都 连接 到 屏幕 ， 而 不 是 保存 到 磁 瘟 文件 。 除 此 之 外 ， 许 多 程序 从 一 个 叫做 标准 输入 (stdin) 的 设备 得 到 输入 ， 默 认 情 
况 下 ， 标准 输入 连接 到 键盘 。 








IO 重 定向 允许 我 们 可 以 更 改 输 出 走向 和 输入 来 向 。 一 般 地 ， 输 出 送 到 屏幕 ， 输 入 来 自 键 胡 ， 但 是 通过 I/O 重 定向 ， 我 们 可 以 
改变 输入 输出 方向 。 


重 定向 标准 输出 
IO 重 定向 允许 我 们 来 重 定义 标准 输出 送 到 哪里 。 重 定向 标准 输出 到 另 一 个 文件 除了 屏幕 ， 我 们 使 用 ">" 重 定向 符 ， 其 后 跟着 


文件 名 。 为 什么 我 们 要 这 样 做 呢 ? 因为 有 时 候 把 一 个 命令 的 运行 结果 存储 到 一 个 文件 很 有 用 处 。 例 如 ， 我 们 可 以 告诉 shell 
把 Is 命令 的 运行 结果 输送 到 文件 Is-outputtxt 中 去 ， 由 文件 代替 屏幕 。 





[me@linuxbox ~]$ ls -| /usr/bin > ls-output.txt 


这 里 ， 我 们 创建 了 一 个 长 长 的 目录 /Usr/bin 列表 ， 并 且 输 送 程序 运行 结果 到 文件 ls-outputtxt 中 。 我 们 检查 一 下 重 定向 的 命令 
输出 结果 : 


[me@linuxbox ~]$ ls -| Is-output.txt 
-rw-rw-r--1 me me 167878 2008-02-01 15:07 ls-output.txt 


好 ; 一 个 不 错 的 大 型 文本 文件 。 如 果 我 们 用 less 阅读 器 来 查看 这 个 文件 ， 我 们 会 看 到 文件 ls-output.txt 的 确 包含 |s 命令 的 执 
行 结果 。 


[me@linuxbox ~]$ less ls-output.txt 


现在 ， 重 复 我 们 的 重 定向 测试 ， 但 这 次 有 改动 。 我 们 把 目录 换 成 一 个 不 存在 的 目录 。 


[me@linuxbox ~]$ ls -| /bin/usr > ls-output.txt 
ls: cannot access /bin/usr: No such file or directory 


我 们 收 到 一 个 错误 信息 。 这 很 有 意义 ， 因 为 我 们 指定 了 一 个 不 存在 的 目录 /bin/usr, 但 是 为 什么 这 条 错误 信息 显示 在 屏幕 上 而 
不 是 被 重 定向 到 文件 |s-output.txt? 答案 是 ， |s 程序 不 把 它 的 错误 信息 输送 到 标准 输出 。 反 而 ， 像 许多 写 得 不 错 的 Unix 程 

序 ，ls 把 错误 信息 送 到 标准 错误 。 因 为 我 们 只 是 重 定向 了 标准 输出 ， 而 没有 重 定向 标准 错误 ， 所 以 错误 信息 被 送 到 屏幕 。 马 
上 ， 我 们 将 知道 怎样 重 定向 标准 错误 ， 但 是 首先 看 一 下 我 们 的 输出 文件 发 生 了 什么 事情 。 


me@linuxbox ~]$ ls -| Is-output.txt 
-rwW-rw-r-- 1 me me 02008-02-01 15:08 ls-output.txt 


文件 长 度 成 为 雾 ! 这 是 因为 ， 当 我 们 使 用 ">" 重 定向 符 来 重 定向 输出 结果 时 ， 目 标 文件 总 是 从 开头 被 重 写 。 因为 我 们 Is 命 兮 
没有 产生 运行 结果 ， 只 有 错误 信息 ， 重 定向 操作 开始 重 写 文 件 ， 然 后 由 于 错误 而 停止 ， 导 致 文件 内 容 删 除 。 事 实 上 ， 如 果 我 
们 需要 删除 一 个 文件 内 容 (或 者 创建 一 个 新 的 空 文件 ) ， 可 以 使 用 这 样 的 技巧 : 


[me@linuxbox ~]$ > ls-output.txt 


简单 地 使 用 重 定向 符 ， 没 有 命令 在 它 之 前 ， 这 会 删除 一 个 已 存在 文件 的 内 容 或 是 创建 一 个 新 的 空 文件 。 





所 以 ， 怎 洋 才 能 把 重 定向 结果 追加 到 文件 内 容 后 面 ， 而 不 是 从 开头 重 罕 文件? 为 了 这 个 目的 ， 我 们 使 用 ">>" 重 定向 符 ， 像 这 
样 : 


[me@linuxbox ~]$ ls -| /usr/bin >> ls-output.txt 


使 用 ">>" 操 作 符 ， 将 导致 输出 结果 添加 到 文件 内 容 之 后 。 如 果 文 件 不 存在 ， 文 件 会 被 创建 ， 就 如 使 用 了 '>' 操 作 符 。 把 它 放 到 
测试 中 : 


[me@linuxbox ~]$ ls -| /usr/bin >> ls-output.txt 
[me@linuxbox ~]$ ls -| Is-output.txt 
-rwW-rw-r-- 1 me me 503634 2008-02-01 15:45 ls-output.txt 


我 们 重复 执行 命令 三 次 ， 导 致 输出 文件 大 小 是 原来 的 三 倍 。 

重 定向 标准 错误 

重 定向 标准 错误 缺乏 专用 的 重 定向 操作 符 。 重 定向 标准 错误 ， 我 们 必须 参考 它 的 文件 描述 符 。 一 个 程序 可 以 在 几 个 编号 的 文 
件 流 中 的 任 一 个 上 产生 输出 。 然 而 我 们 必须 把 这 些 文 件 流 的 前 三 个 看 作 标准 输入 ， 输 出 和 错误 ，shell 内 部 参考 它们 为 文件 


描述 符 0，1 和 2， 各 自 地 。shell 提供 了 一 种 表示 法 来 重 定 向 文件 ， 使 用 文件 描述 符 。 因 为 标准 错误 和 文件 描述 符 2 一 样 ， 我 
们 用 这 种 表示 法 来 重 定向 标准 错误 : 


[me@linuxbox ~]$ Is -| /bin/usr 2> ls-error.txt 


文件 描述 符 "2"， 紧 挨 着 放 在 重 定 向 操作 符 之 前 ， 来 执行 重 定向 标准 错误 到 文件 Is-error.txt 任务 。 


重 定向 标准 输出 和 错误 到 同一 个 文件 


可 能 有 这 种 情况 ， 我 们 希望 捕捉 一 个 命令 的 所 有 输出 到 一 个 文件 。 为 了 完成 这 个 ， 我 们 必须 同时 重 定向 标准 输出 和 标准 错 
误 。 有 两 种 方法 来 完成 任务 。 第 一 个 ， 传 统 的 方法 ， 在 旧版 本 shell 中 也 有 效 : 


[me@linuxbox ~]$ ls -| /bin/usr > ls-output.txt 2>&1 


使 用 这 种 方法 ， 我 们 完成 两 个 重 定 向 。 首 先 重 定向 标准 输出 到 文件 ls-output.txt， 然 后 重 定向 文件 描述 符 2 (标准 错误 ) 到 文 
件 描述 符 1 (标准 输出 ) 使 用 表示 法 2>&1。 


注意 重 定向 的 顺序 安排 非常 重要 。 标 准 错误 的 重 定向 必须 总 是 出 现在 标准 输出 重 定向 之 后 ， 要 不 然 它 不 起 作用 。 上 面 的 例 
也 


>ls-output.txt 2>&1 


重 定向 标准 错误 到 文件 Is-outputtxt， 但 是 如 果 命 令 顺 序 改 为 : 


2>&1 >ls-output.txt 


则 标准 错误 定向 到 屏幕 。 


现在 的 bash 版 本 提供 了 第 二 种 方法 ， 更 精简 合理 的 方法 来 执行 这 种 联合 的 重 定向 。 
[me@linuxbox ~]$ ls -| /bin/usr &> ls-output.txt 


在 这 个 例子 里 面 ， 我 们 使 用 单单 一 个 表示 法 &> 来 重 定向 标准 输出 和 错误 到 文件 |s-output.txt。 


处 理 不 需要 的 输出 
有 时 候 "沉默 是 金 "我 们 不 想 要 一 个 命令 的 输出 结果 ， 只 想 把 它们 扔 掉 。 这 种 情况 尤其 适用 于 错误 和 状态 信息 。 系 统 为 我 们 


提供 了 解决 问题 的 方法 ， 通 过 重 定向 输出 结果 到 一 个 特殊 的 叫做 "/dev/null" 的 文件 。 这 个 文件 是 系统 设备 ， 叫 做 位 存储 桶 ， 
它 可 以 接受 输入 ， 并 且 对 输入 不 做 任何 处 理 。 为 了 隐瞒 命令 错误 信息 ， 我 们 这 样 做 : 


[me@linuxbox ~]$ Is -| /bin/usr 2> /dewnull 


Unix 文化 中 的 /dev/null 


位 存储 桶 是 个 古老 的 Unix 概念 ， 由 于 它 的 普通 性 ， 它 的 身影 出 现在 Unix 文化 的 许多 部 分 。 当 有 人 说 他 /她 正在 发 送 你 
的 评论 到 /devnull， 现 在 你 应 该 知道 那 是 什么 意思 了 。 更 多 的 例子 ， 可 以 阅读 Wikipedia 关于 "/dev/null" 的 文章 。 


重 定向 标准 输入 


到 目前 为 止 ， 我 们 还 没有 遇 到 一 个 命 倒是 利用 标准 输入 的 (实际 上 我 们 遇 到 过 了 ， 但 是 一 会 儿 再 揭晓 谜底 ) ， 所 以 我 们 需要 


介绍 一 个 。 


cat 一 连接 文件 


cat 命令 读 取 一 个 或 多 个 文件 ， 然 后 复制 它们 到 标准 输出 ， 就 像 这 样 : 
cat [file] 


在 大 多 数 情 况 下 ， 你 可 以 认为 cat 命令 相似 于 DOS 中 的 TYPE 命令 。 你 可 以 使 用 cat 来 显示 文件 而 没有 分 页 ， 例 如 : 


[me@linuxbox ~]$ cat ls-output.txt 


a he ii A a 因为 cat 可 以 接受 不 只 一 个 文件 作为 参数 ， 所 以 它 
也 可 以 用 来 把 文件 连接 在 一 起 。 上 比方 说 我 们 下 载 了 一 个 大 型 文件 ， 这 个 文件 被 分 离 成 多 个 部 分 (USENET 中 的 多 媒体 文件 经 
常 以 这 种 方式 分 离 ) ， 我 们 想 把 它们 连 起 来 。 如 果 文 件 命 名 为 : 


我 们 能 用 这 个 命令 把 它们 连接 起 来 : 


cat movie.mpeg.0* > movie.mpeg 


因为 通配符 总 是 以 有 序 的 方式 展开 ， 所 以 这 些 参数 会 以 正确 顺序 安排 。 


这 很 好 ， 但 是 这 和 标准 输入 有 什么 关系 呢 ?没有 任何 关系 ， 让 我 们 试 着 做 些 其 他 的 工作 。 如 果 我 们 输入 不 带 参数 的 "cat' 命 
合 ， 会 发 生 什么 呢 : 


[me@linuxbox ~]$ cat 


没有 发 生 任何 事情 ， 它 只 是 坐 在 那里 ， 好 像 挂 掉 了 一 样 。 看 起 来 是 那样 ， 但 是 它 正在 做 它 该 做 的 事情 : 


WA 会 从 标准 输入 读 入 数据 ， 因 为 标准 输入 ， 默 认 情 况 下 ， 连 接 到 键盘 。 它 正在 等 待 我 们 输入 数 
据 ! 试 试 这 个 : 





[me@linuxbox ~]$ cat 
The quick brown fox jumped over the lazy dog. 


下 一 步 ， 输 入 Ctrl-d 〈 按 住 Ctrl 键 同 时 按 下 "d") ， 来 告诉 cat， 在 标准 输入 中 ， 它 已 经 到 达 文 件 末 尾 (EOF) 


[me@linuxbox ~]$ cat 
The quick brown fox jumped over the lazy dog. 


由 于 文件 名 参数 的 缺席 ，cat 复制 标准 输入 到 标准 输出 ， 所 以 我 们 看 到 文本 行 重复 出 现 。 我 们 可 以 使 用 这 种 行为 来 创建 简短 
的 文本 文件 。 上 比方 说 ， 我 们 想 创 建 一 个 叫做 "lazy_dog.txt" 的 文件 ， 这 个 文件 包含 例子 中 的 文本 。 我 们 这 样 做 : 


[me@linuxbox ~]$ cat > lazy_dog.txt 
The quick brown fox jumped over the lazy dog. 


输入 命 今 ， 入 要 放 和 文件 中 的 文本 。 记 住 ， 最 后 输入 Ctrl-d。 通 过 使 用 这 个 命 仿 ， 我 们 实现 了 世界 上 最 低能 的 文字 处 
理 器 ! 看 一 下 运行 结果 ， 我 们 使 用 cat 来 复制 文件 内 容 到 标准 输出 : 


[me@linuxbox ~]$ cat lazy_dog.txt 
The quick brown foxjumped over the lazy dog. 


现在 我 们 知道 怎 讲 接受 标准 输入 ， 除 了 文件 名 参数 ， 让 我 们 试 着 重 定向 标准 输入 : 


[me@linuxbox ~]$ cat < lazy_dog.txt 
The quick brown foxjumped over the lazy dog. 


使 用 "<" 重 定向 操作 符 ， 我 们 把 标准 输入 源 从 键盘 改 到 文件 lazy_dog.tx。 我 们 看 到 结果 和 传递 单个 文件 名 作为 参数 的 执行 结 
果 一 样 。 把 这 和 传递 一 个 文件 名 参数 作 上 比较 ， 尤 其 没有 意义 ， 但 它 是 用 来 说 明 把 一 个 文件 作为 标准 输入 源 。 


在 我 们 继续 之 前 ， 查 看 cat 的 手册 页 ， 因 为 它 有 几 个 有 趣 的 选项 。 


管道 线 


命令 可 以 从 标准 输入 读 取 数 据 ， 然 后 再 把 数据 输送 到 标准 输出 ， 命 邻 的 这 种 能 力 被 一 个 shell 特性 所 利用 ， 这 个 特性 叫做 管 
道 线 。 使 用 管道 操作 符 "TP" ( 坚 杠 ) ， 一 个 命令 的 标准 输出 可 以 管道 到 另 一 个 命令 的 标准 输入 : 


commandl | command2 


为 了 全 面 地 说 明 这 个 命令 ， 我 们 需要 一 些 命令 。 是 否 记得 我 们 说 过 ， 我 们 已 经 知道 有 一 个 命令 接受 标准 输入 ? 它 是 less 命 
邻 。 我 们 用 less 来 一 页 一 页 地 显示 任何 命令 的 输出 ， 命 令 把 它 的 运行 结果 输送 到 标准 输出 : 


[me@linuxbox ~]$ ls -| /usr/bin | less 


这 极其 方便 ! 使 用 这 项 技术 ， 我 们 可 以 方便 地 检测 会 产生 标准 输出 的 任 一 命令 的 运行 结果 。 


管道 线 经 常用 来 对 数据 完成 复杂 的 操作 。 有 可 能 会 把 几 个 命令 放 在 一 起 组 成 一 个 管道 线 。 通常 ， 以 这 种 方式 使 用 的 命令 被 称 
为 过 滤器 。 过 滤器 接受 输入 ， 以 某 种 方式 改变 它 ， 然 后 输出 它 。 第 一 个 我 们 想 试 验 的 过 滤器 是 sort。 想 象 一 下 ， 我 们 想 把 目 
录 /bin 和 /usrbin 中 的 可 执行 程序 都 联合 在 一 起 ， 再 把 它们 排序 ， 然 后 浏览 执行 结果 : 


[me@linuxbox ~]$ ls /bin /usr/bin | sort | less 





因为 我 们 指定 了 两 个 目录 (/bin 和 /usr/bin) ，ls 命令 的 输出 结果 由 有 序列 表 组 成 ， 各 自 针 对 一 个 目录 。 通 过 在 管道 线 中 包含 
sort， 我 们 改变 输出 数据 ， 从 而 产生 一 个 有 序列 表 。 


uniq - 报道 或 忽略 重复 行 
unid 命令 经 常 和 sort 命令 结合 在 一 起 使 用 。uniq 从 标准 输入 或 单个 文件 名 参数 接受 数据 有 序 列表 (详情 查看 uniq 手册 


页 ) ， 黑 认 情 况 下 ， 从 数据 列表 中 删除 任何 重复 行 。 所 以 ， 为 了 确信 我 们 的 列表 中 不 包含 重复 句子 (这 是 说 ， 出 现在 目 
录 /bin 和 /usrbin 中 重 名 的 程序 ) ， 我 们 添加 uniq 到 我 们 的 管道 线 中 : 


[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | less 


在 这 个 例子 中 ， 我 们 使 用 uniq 从 sort 命令 的 输出 结果 中 ， 来 删除 任何 重复 行 。 如 果 我 们 想 看 到 重复 的 数据 列表 ， 让 uniq 命 
令 带 上 '"-d" 选 项 ， 就 像 这 样 : 


[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq -d | less 
wc 一 打印 行 ， 字 和 字 节 数 
wc ( 字 计 数 ) 命令 是 用 来 显示 文件 所 包含 的 行 ， 字 和 字 节 数 。 例 如 : 


[me@linuxbox ~]$ wc ls-output.txt 
7902 64566 503634 ls-output.txt 


在 这 个 例子 中 ，wc 打印 出 来 三 个 数字 : 包含 在 文件 ls-output.txt 中 的 行 数 ， 单 词 数 和 字 节 数 ， 正如 我 们 先前 的 命令 ， 如 果 
WC 不 带 命 邻 行 参数 ， 它 接受 标准 输入 。"-|" 选 项 限制 命令 输出 只 能 报道 行 数 。 添 加 wc 到 管道 线 来 统计 数据 ， 是 个 很 便利 的 
方法 。 查 看 我 们 的 有 序列 表 中 程序 个 数 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | wc -| 
2728 


grep 一 打印 匹配 行 


grep 是 个 很 强大 的 程序 ， 用 来 找到 文件 中 的 匹配 文本 。 这 样 使 用 grep 命令 : 
grep pattern [file...] 


当 grep 遇 到 一 个 文件 中 的 匹配 "模式 "， 它 会 打印 出 包含 这 个 类 型 的 行 。grep 能 够 匹配 的 模式 可 以 很 复杂 ， 但 是 现在 我 们 把 
注意 力 集中 在 简单 文本 匹配 上 面 。 在 后 面 的 章节 中 ， 我 们 将 会 研究 高 级 模式 ， 叫 做 正则 表达 式 。 


比如 说 ， 我 们 想 在 我 们 的 程序 列表 中 ， 找 到 文件 名 中 包含 单词 "zip" 的 所 有 文件 。 这 样 一 个 搜索 ， 可 能 让 我 们 了 解 系 统 中 的 一 
些 程序 与 文件 压缩 有 关系 。 这 样 做 : 


[me@linuxbox ~]$ ls /bin /usr/bin | sort | uniq | grep zip 
bunzip2 

bzip2 

gunzip 


grep 有 一 对 方便 的 选项 :"-j "导致 grep 忽略 大 小 写 当 执行 搜索 时 (通常 ， 搜 索 是 大 小 写 敏感 的 ) ，"-V" 选 项 会 告诉 grep 只 打 
印 不 匹配 的 行 。 


head / tail 一 打印 文件 开头 部 分 /结尾 部 分 


有 时 候 你 不 需要 一 个 命令 的 所 有 输出 。 可 能 你 只 想 要 前 几 行 或 者 后 几 行 的 输出 内 容 。 head 命令 打印 文件 的 前 十 行 ， 而 tail 
命令 打印 文件 的 后 十 行 。 黑 认 情 况 下 ， 两 个 命令 都 打印 十 行文 本 ， 但 是 可 以 通过 "-m' 选 项 来 调整 命 舍 打 印 的 行 数 。 


[me@linuxbox ~]$ head -n 5 Is-output.txt 
total 343496 


[me@linuxbox ~]$ tail -n 5 Is-output.txt 


它们 也 能 用 在 管道 线 中 : 


[me@linuxbox ~]$ ls /usr/bin | tail -n 5 
znew 


tail 有 一 个 选项 允许 你 实时 的 浏览 文件 。 当 观察 日 志文 件 的 进展 时 ， 这 很 有 用 ， 因 为 它们 同时 在 被 室 入。 在 以 下 的 例子 里 ， 
我 们 要 查看 目录 /Var/log 里 面 的 信息 文件 。 在 一 些 Linux 发 行 版 中 ， 要 求 有 超级 用 户 权限 才 能 阅读 这 些 文件 ， 因 为 文 
件 Nar/log/messages 可 能 包含 安全 信息 。 


[me@linuxbox ~]$ tail -f /var/log/messages 
Feb 8 13:40:05 twin4 dhclient: DHCPACK from 192.168.1.1 


使 用 "-f' 选 项 ，tail 命令 继续 监测 这 个 文件 ， 当 新 的 内 容 添 加 到 文件 后 ， 它 们 会 立即 出 现在 屏幕 上 。 这 会 一 直 继 续 下 去 直到 你 
输入 Ctrl-c。 


tee 一 从 Stdin 读 取 数 据 ， 并 同时 输出 到 Stdout 和 文件 


为 了 和 我 们 的 管道 隐喻 保持 一 致 ，Linux 提供 了 一 个 叫做 tee 的 命令 ， 这 个 命令 制造 了 一 个 "tee"， 安 装 到 我 们 的 管道 上 。tee 
程序 从 标准 输入 读 人 数据 ， 并 且 同 时 复制 数据 到 标准 输出 (允许 数据 继续 随 着 管道 线 流动 ) 和 一 个 或 多 个 文件 。 当 在 某 个 中 
间 处 理 阶段 来 捕捉 一 个 管道 线 的 内 容 时 ， 这 很 有 帮助 。 这 里 ， 我 们 重复 执行 一 个 先前 的 例子 ， 这 次 包含 tee 命 舍 ， 在 grep 
过 滤 管 道 线 的 内 容 之 前 ， 来 捕捉 整个 目录 列表 到 文件 ls.txt : 





[me@linuxbox ~]$ Is /usrbin | tee ls.txt | grep zip 
bunzip2 
bzip2 


一 如 既往 ， 查 看 这 章 学 到 的 每 一 个 命令 的 文档 。 我 们 已 经 知道 了 他 们 最 基本 的 用 法 。 它们 还 有 很 多 有 趣 的 选项 。 随 着 我 们 
Linux 经 验 的 积累 ， 我 们 会 了 解 命令 行 重 定向 特性 在 解决 特殊 间 题 时 非常 有 用 处 。 有 许多 命令 利用 标准 输入 和 输出 ， 而 几乎 
所 有 的 命令 行 程序 都 使 用 标准 错误 来 显示 它们 的 详细 信息 。 


Linux 可 以 激发 我 们 的 想象 





当 我 被 要 求解 释 Windows 与 Linux 之 间 的 差异 时 ， 我 经 常 拿 玩具 来 作 比 喻 。 


Windows 就 像 一 个 游戏 机 。 你 去 商店 ， 买 了 一 个 包装 在 盒子 里 面 的 全 新 的 游戏 机 。 你 把 它 带 回 家 ， 打 开 盒 子 ， 开 始 玩 
游戏 。 精 美的 画面 ， 动 人 的 声音 。 玩 了 一 段 时 间 之 后 ， 你 厌 俊 了 它 自 带 的 游戏 ， 所 以 你 返回 商店 ， 又 买 了 另 一 个 游戏 
机 。 这 个 过 程 反 复 重 复 。 最 后 ， 你 玩 腻 了 游戏 机 自 带 的 游戏 ， 你 回 到 商店 ， 告 诉 售货员 , “我 想 要 一 个 这 样 的 游戏 1” 
但 售货员 告诉 你 没有 这 样 的 游戏 存在 ， 因 为 它 没有 “市 场 需求 "。 然 后 你 说 ，“ 但 是 我 只 需要 修改 一 下 这 个 游戏 ! “， 售 货 
员 又 告诉 你 不 能 修改 它 。 所 有 游戏 都 被 封装 在 它们 的 存储 器 中 。 到 头 来 ， 你 发 现 你 的 玩具 只 局 限于 别人 为 你 规定 好 的 


另 一 方面 ，Linux 就 像 一 个 全 世界 上 最 大 的 建造 模型 。 你 打开 它 ， 发 现 它 只 是 一 个 巨大 的 部 件 集合 。 有 许多 钢 支 柱 ， 
螺 行 ， 螺 母 ， 齿 轮 ， 滑 轮 ， 发 动机 ， 和 一 些 怎样 来 建造 它 的 说 明 书 。 然后 你 开始 摆弄 它 。 你 建造 了 一 个 又 一 个 样板 模 
型 。 过 了 一 会 儿 ， 你 发 现 你 要 建造 自己 的 模型 。 你 不 必 返 回 商店 ， 因 为 你 已 经 拥有 了 你 需要 的 一 切 。 建 造 模型 以 你 构 
想 的 形状 为 模板 ， 搭 建 你 想 要 的 模型 。 


当然 ， 选 择 哪 一 个 玩具 ， 是 你 的 事情 ， 那 么 你 觉得 哪个 玩具 更 令 人 满意 呢 ? 


从 shell 眼中 看 世界 


在 这 一 章 我 们 将 看 一 下 ， 当 你 按 下 enter 键 后 ， 发 生 在 命令 行 中 的 一 些 "魔法 "。 虽然 我 们 会 仔细 查看 几 个 复杂 有 趣 的 shell 特 
点 ， 但 我 们 只 使 用 一 个 新 命令 来 义理 这 些 特 性 。 


echo 一 显示 一 行文 本 


(字符 ) 展 开 


每 一 次 你 输入 一 个 命令 ， 然 后 按 下 enter 键 ， 在 bash 执行 你 的 命令 之 前 ，bash 会 对 输入 的 字符 完成 几 个 步骤 处 理 。 我 们 已 
经 知道 两 三 个 案例 ， 怎 样 一 个 简单 的 字符 序列 ， 例 如 '"*", 对 shell 来 说 ， 有 很 多 的 涵义 。 使 这 个 发 生 的 过 程 叫做 (字符 ) 展 
开 。 通 过 展开 ， 你 输入 的 字符 ， 在 shell 对 它 起 作用 之 前 ， 会 展开 成 为 别 的 字符 。 为 了 说 明 我 们 所 要 表达 的 意思 ， 让 我 们 看 
一 看 echo 命 舍 。echo 是 一 个 shell 内 部 命令 ， 来 完成 非常 简单 的 认为 。 它 在 标准 输出 中 打印 出 它 的 文本 参数 。 


[me@linuxbox ~]$ echo this is a test 
this is a test 





这 个 命令 的 作用 相当 简单 明了 。 传 递 到 echo 命令 的 任 一 个 参数 都 会 在 〈 屏 幕 上 ) 显示 出 来 。 让 我 们 试 试 另 一 个 例子 : 


[me@linuxbox ~]$ echo * 
Desktop Documents ls-output.txt Music Pictures Public Templates Videos 


那么 刚才 发 生 了 什么 事情 呢 ? 为 什么 echo 不 打印 * 呢 ? 随 着 你 回想 起 我 们 所 学 过 的 关于 通配符 的 内 容 ， 这 个 '*" 字 符 意味 着 
匹配 文件 名 中 的 任意 字符 ， 但 是 在 原先 的 讨论 中 我 们 却 不 知道 shell 是 怎样 实现 这 个 功能 的 。 最 简单 的 答案 就 是 shell 把 "*" 展 
开 成 了 另外 的 东西 (在 这 种 情况 下 ， 就 是 在 当前 工作 目录 下 的 文件 名 字 ) ， 在 echo 命 令 被 执行 前 。 当 回 车 键 被 按 下 

时 ，shell 在 命令 被 执行 前 在 命令 行 上 自动 展开 任何 符合 条 件 的 字符 ， 所 以 echo 命 合 从 不 会 发 现 “", 只 把 它 展开 成 结果 。 知 道 
了 这 个 以 后 ， 我 们 能 看 到 echo 执 行 的 结果 和 我 们 想象 的 一 样 。 





路 径 名 展开 


这 种 通配符 工作 机 制 叫做 路 径 名 展开 。 如 果 我 们 试 一 下 在 之 前 的 章节 中 使 用 的 技巧 ， 我 们 会 看 到 它们 真是 要 展开 的 字符 。 给 
出 一 个 主 目录 ， 它 看 起 来 像 这 样 : 


[me@linuxbox ~]$ 1s 
Desktop ls-output.txt Pictures Templates 


我 们 能 够 执行 以 下 参数 展开 模式 : 


[me@linuxbox ~]$ echo D* 
Desktop Documents 


和 : 


[me@linuxbox ~]$ echo *s 
Documents Pictures Templates Videos 


甚至 是 : 


[me@linuxbox ~]$ echo [[:upper:]]* 
Desktop Documents Music Pictures Public Templates Videos 


查看 主 目录 之 外 的 目录 : 


[me@linuxbox ~]$ echo /usr/*/share 
/usr/kerberos/share /usr/local/share 


隐藏 文件 路 径 名 展开 

正如 我 们 知道 的 ， 以 圆 点 字符 开头 的 文件 名 是 隐藏 文件 。 路 径 名 展开 也 尊重 这 种 行为 。 像 这 样 的 展开 : 
echo* 

会 显示 隐藏 文件 


要 是 展开 模式 以 一 个 国 点 开头 ， 我 们 就 能 金 在 展开 模式 中 包含 隐 藏 文件 ， 而 且 隐 藏 文件 可 能 会 出 现在 第 一 位 置 ， 就 像 
这 样 : 





echo.* 





指 当前 工作 目录 和 它 的 父 目 录 ， 使 用 这 种 模式 可 能 会 产生 不 正确 的 结果 。 我 们 能 看 到 这 样 的 结果 ， 如 果 我 们 试 一 下 
这 个 命令 : 
ls -d * | less 


为 了 在 这 种 情况 下 正确 地 完成 路 径 名 展开 ， 我 们 应 该 硅 佣 一 个 更 精确 些 的 模式 。 这 个 模式 会 正确 地 工作 : 


ls -d [1]?* 
这 种 模式 展开 成 为 文件 名 ， 每 个 文件 名 以 圆 点 开头 ， 第 二 个 字符 不 包含 圆 点 ， 再 包含 至 少 一 个 字符 ， 并 且 这 个 字符 之 
后 紧 接 着 任意 多 个 字符 。 这 将 列 出 大 多 数 的 隐藏 文件 (但 仍 将 不 能 包含 以 多 个 圆 点 开头 的 文件 名 ) 这 个 带 有 -A 选项 





(“几乎 所 有 ”) 的 s 命令 能 够 提供 一 份 正 确 的 隐藏 文件 清单 : 


ls -A 
波浪 线 展开 


可 能 你 从 我 们 对 cd 命 命 的 介绍 中 回想 起 来 ， 波 浪 线 字符 ("~") 有 特殊 的 意思 。 当 它 用 在 一 个 单词 的 开头 时 ， 它 会 展开 成 指定 
用 户 的 主 目录 名 ， 如 果 没 有 指定 用 户 名 ， 则 是 当前 用 户 的 主 目录 : 


[me@linuxbox ~]$ echo ~ 
/home/me 


如 果 有 用 户 "foo" 这 个 帐号 ， 然 后 : 


[me@linuxbox ~]$ echo ~foo 
/home/foo 


算术 表达 式 展 开 
shell 允许 算术 表达 式 通过 展开 来 执行 。 这 人 允许 我 们 把 shell 提示 当 作 计算 器 来 使 用 : 


[me@linuxbox ~]$ echo $((2 + 2)) 
4 


算术 表达 式 展开 使 用 这 种 格式 : 


$((expression)) 


(以 上 括号 中 的 ) 表达 式 是 指 算术 表达 式 ， 它 由 数值 和 算术 操作 符 组 成 。 
算术 表达 式 只 支持 整数 (全 部 是 数字 ， 不 带 小 数 点 ) ， 但 是 能 执行 很 多 不 同 的 操作 。 这 里 是 一 些 它 支持 的 操作 符 : 


表 8-1: 算术 操作 符 


操作 符 说 明 
+ 加 
减 
乘 
/ 除 (但 是 记 住 ， 因 为 展开 只 是 支持 整数 除法 ， 所 以 结果 是 整数 。) 
% 取 余 ， 只 是 简单 的 意味 着 ，“ 余 数 ” 
人 取 乱 


在 算术 表达 式 中 空格 并 不 重要 ， 并 且 表 达 式 可 以 找 套 。 例 如 ，5 的 平方 乘 以 3 : 


[me@linuxbox ~]$ echo $(($((5**2)) * 3)) 
7 


一 对 括号 可 以 用 来 把 多 个 子 表达 式 括 起 来 。 通 过 这 个 技术 ， 我 们 可 以 重 写 上 面 的 例子 ， 同时 用 一 个 展开 代替 两 个 ， 来 得 到 一 
样 的 结果 : 


[me@linuxbox ~]$ echo $(((5**2) * 3)) 
Ey 


这 个 一 个 使 用 除法 和 取 余 操作 符 的 例子 。 注 意 整 数 除 法 的 结果 : 


[me@linuxbox ~]$ echo Five divided by two equals $((5/2)) 
Five divided by two equals 2 

[me@linuxbox ~]$ echo with $((5%2)) left over. 

with 1 left over. 


在 35 章 会 更 深入 的 讨论 算术 表达 式 的 内 容 。 


花 括号 展开 


可 能 最 奇怪 的 展开 是 花 括号 展开 。 通 过 它 ， 你 可 以 从 一 个 包含 花 括号 的 模式 中 创建 多 个 文本 字符 串 。 这 是 一 个 例子 : 


[me@linuxbox ~]$ echo Front-{A,B,C}-Back 
Front-A-Back Front-B-Back Front-C-Back 





花 括号 展开 模式 可 能 包含 一 个 开头 部 分 叫做 报头 ， 一 个 结尾 部 分 叫做 附 言 。 花 括号 表达 式 本 身 可 能 包含 一 个 由 逗号 分 开 的 字 
符 串 列表 ， 或 者 一 系列 整数 ， 或 者 单个 的 字符 串 。 这 种 模式 可 能 不 包括 嵌入 的 空白 。 这 个 例题 使 用 了 一 系列 整数 : 


[me@linuxbox ~]$ echo Number {1..5} 
Number 1 Number 2 Number 3 Number 4 Number 5 


一 系列 以 倒序 排列 的 字母 : 


[me@linuxbox ~]$ echo {2Z..A} 
ZY XMWV UMS RIORPONIVI KOUHNG ED BA 


花 括 号 展开 可 以 嵌 套 : 


[me@linuxbox ~]$ echo a{A{1,2},B{3,4}}b 
aAlb aA2b aB3b aB4b 


那么 这 对 什么 有 好 处 呢 ? 最 普 静 的 应 用 是 ， 创 建 一 系列 的 文件 或 目录 列表 。 例 如 ， 如 果 我 们 是 摄影 关 ， 有 大 量 的 相片 。 我 们 
想 把 这 些 相 片 按 年 月 先后 组 织 起 来 。 首 先 ， 我 们 要 创建 一 系列 以 数值 "年 一 月 "形式 命名 的 目录 。 通 过 这 种 方式 ， 目 录 名 按照 
年 代 顺 序 排列 。 我 们 可 以 键入 整个 目录 列表 ， 但 是 工作 量 太 大 了 ， 并 且 易 于 出 错 。 反而 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ mkdir Pics 

[me@linuxbox ~]$ cd Pics 

[me@linuxbox Pics]$ mkdir {2007..2009}-0{1..9} {2007..2009}-{10..12} 
[me@linuxbox Pics]$ ls 

2007-01 2007-07 2008-01 2008-07 2009-01 2009-07 

2007-02 2007-08 2008-02 2008-08 2009-02 2009-08 

2007-03 2007-09 2008-03 2008-09 2009-03 2009-09 

2007-04 2007-10 2008-04 2008-10 2009-04 2009-10 

2007-05 2007-11 2008-05 2008-11 2009-05 2009-11 

2007-06 2007-12 2008-06 2008-12 2009-06 2009-12 


棒 极 了 ! 


参数 展开 


在 这 一 章 我 们 将 会 简单 地 介绍 参数 展开 ， 只 是 皮毛 而 已 。 后 续 章节 我 们 会 广泛 地 讨论 参数 展开 。 这 个 特性 在 shell 脚本 中 比 
直接 在 命令 行 中 更 有 用 。 它 的 许多 性 能 和 系统 存储 小 块 数据 ， 并 给 每 块 数 据 命名 的 能 力 有 关系 。 许 多 像 这 样 的 小 块 数 据 ， 更 
适当 些 应 叫做 变量 ， 可 以 方便 地 检查 它们 。 例 如 ， 叫 做 "USER" 的 变量 包含 你 的 用 户 名 。 唤 醒 参数 展开 ， 揭 示 USER 中 的 内 
容 ， 可 以 这 样 做 : 


[me@linuxbox ~]$ echo $USER 
me 


查看 有 效 的 变量 列表 ， 试 试 这 个 : 
[me@linuxbox ~]$ printenv | less 


你 可 能 注意 到 其 它 展 开 类 型 ， 如 果 你 误 输 入 一 个 模式 ， 展 开 就 不 会 发 生 。 这 时 echo 命 合 只 简单 地 显示 误 键入 的 模式 。 通 过 
参数 展开 ， 如 果 你 拼写 错 了 一 个 变量 名 ， 展开 仍然 会 进行 ， 只 是 展 成 一 个 空 字符 串 : 


[me@linuxbox ~]$ echo $SUER 


[me@linuxbox ~]$ 


命令 蔡 换 


命令 替换 允许 我 们 把 一 个 命令 的 输出 作为 一 个 展开 模式 来 使 用 : 


号 


[me@linuxbox ~]$ echo $(1s) 
Desktop Documents ls-output.txt Music Pictures Public Templates 
Videos 


[me@linuxbox ~]$ Ils -| $(which cp) 
-rWxr-xr-x 1 root root 71516 2007-12-05 08:58 /bin/cp 


这 里 我 们 把 which cp 的 执行 结果 作为 一 个 参数 传递 给 |s 命 舍 ， 因 此 要 想得到 cp 程序 的 输出 列表 ， 不 必 知 道 它 完整 的 路 径 
名 。 我 们 不 只 限制 于 简单 命令 。 也 可 以 使 用 整个 管道 线 (只 展示 部 分 输出 ) 





[me@linuxbox ~]$ file $(ls /usr/bin/* | grep zip) 
/usr/bin/bunzip2: ~ symbolic link to “bzip2' 


在 这 个 例子 中 ， 管 道 线 的 输出 结果 成 为 file 命令 的 参数 列表 。 
在 旧版 shell 程序 中 ， 有 另 一 种 语法 也 支持 命令 蔡 换 ， 可 与 刚 提 到 的 语法 轮换 使 用 。 bash 也 支持 这 种 语法 。 它 使 用 倒 引 号 来 
代替 美元 符号 和 括号 : 


[me@linuxbox ~]$1s -| > which cp 
-rWxr-xr-x 1 root root 71516 2007-12-05 08:58 /bin/cp 


引用 


我 们 已 经 知道 shell 有 许多 方式 可 以 完成 展开 ， 现 在 是 时 候 学 习 怎 样 来 控制 展开 了 。 以 下 面 例子 来 说 明 : 


[me@linuxbox ~]$ echo thisisa test 
this is a test 


或 者 : 


[me@linuxbox ~]$ echo The total is $100.00 
The total is 00.00 


在 第 一 个 例子 中 ，shell 从 echo 命 命 的 参数 列表 中 ， 删 除 多 余 的 空格 。 在 第 二 个 例子 中 ， 参数 展开 把 $1 的 值 蔡 换 为 一 个 空 
字符 串 ， 因 为 1 是 没有 定义 的 变量 。shell 提供 了 一 种 叫做 引用 的 机 制 ， 来 有 选择 地 禁止 不 需要 的 展开 。 


双 引 号 


我 们 将 要 看 一 下 引用 的 第 一 种 类 型 ， 双 引号 。 如 果 你 把 文本 放 在 双 引 号 中 ， shell 使 用 的 特殊 字符 ， 除 了 $,，\( 反 斜 枉 ) ， 和 
、( 倒 引号 ) 之 外 ， 则 失去 它们 的 特殊 含义 ， 被 当 作 普通 字符 来 看 待 。 这 意味 着 单词 分 割 ， 路 径 名 展开 ， 波浪 线 展 开 ， 和 花 
括号 展开 都 被 禁止 ， 然 而 参数 展开 ， 算 术 展 开 ， 和 命 合 蔡 换 仍然 执行 。 使 用 双 引 号 ， 我 们 可 以 处 理 包含 空格 的 文件 名 。 比 方 
说 我 们 是 不 幸 的 名 为 two words.txt 文件 的 受害 者 。 如 果 我 们 试图 在 命令 行 中 使 用 这 个 文件 ， 单 词 分 割 机 制 会 导致 这 个 文件 
名 被 看 作 两 个 独自 的 参数 ， 而 不 是 所 期 望 的 单个 参数 : 


[me@linuxbox ~]$ ls -| two words.txt 
ls: cannot access two: No such file or directory 
ls: cannot access words.txt: No such file or directory 


使 用 双 引 号 ， 我 们 可 以 阻止 单词 分 割 ， 得 到 期 望 的 结果 ; 进一步 ， 我 们 甚至 可 以 修复 破损 的 文件 名 。 


[me@linuxbox ~]$ Is -| "two words.txt" 
-rwW-rw-r-- 1 me me 18 2008-02-20 13:03 two words.txt 
[me@linuxbox ~]$ mv "two words.txt" two_words.txt 


你 瞧 ! 现在 我 们 不 必 一 直 输 入 那些 讨厌 的 双 引 号 了 。 


记 住 ， 在 双 引 号 中 ， 参 数 展 开 ， 算 术 表 达 式 展开 ， 和 命令 蔡 换 仍然 有 效 : 


[me@linuxbox ~]$ echo "$USER $((2+2)) $(cal)" 
me4 February 2008 
Su Mo Tu We Th Fr Sa 


我 们 应 该 花费 一 点 时 间 来 看 一 下 双 引 号 在 命 合 蔡 换 中 的 效果 。 首 先 仔细 研究 一 下 单词 分 割 是 怎样 工作 的 。 在 之 前 的 范例 中 ， 
我 们 已 经 看 到 单词 分 割 机 制 是 怎样 来 删除 文本 中 额外 空格 的 : 


[me@linuxbox ~]$ echo this isa test 
this is a test 


在 默认 情况 下 ， 单 词 分 割 机 制 会 在 单词 中 寻找 空格 ， 制 表 符 ， 和 换行 符 ， 并 把 它们 看 作 单词 之 间 的 界定 符 。 它 们 只 作为 分 隔 
符 使 用 。 因 为 它们 把 单词 分 为 不 同 的 参数 ， 在 范例 中 ， 命令 行 包含 一 个 带 有 四 个 不 同 参数 的 命 售 。 如 果 我 们 加 上 双 引 号 : 


[me@linuxbox ~]$ echo "this is a test" 
this is a test 


单词 分 割 被 禁止 ， 内 工 的 空格 也 不 会 被 当 作 界定 符 ， 它 们 成 为 参数 的 一 部 分 。 一 旦 加 上 双 引 号 ， 我 们 的 命 合 行 就 包含 一 个 带 
有 一 个 参数 的 命令 。 


事实 上 ， 单 词 分 割 机 制 把 换行 符 看 作 界定 符 ， 对 命 合 蔡 换 产生 了 一 个 ， 虽 然 微 妙 ， 但 有 趣 的 影响 。 考虑 下 面 的 例子 : 


[me@linuxbox ~]$ echo $(cal) 

February 2008 Su Mo Tu We ThFrSal1234567891011121314 
EONWLOL9 02 22 2232022520827828529. 

[me@linuxbox ~]$ echo "$(cal)" 

February 2008 


在 第 一 个 实例 中 ， 没 有 引用 的 命令 替换 导致 命令 行 包 含 38 个 参数 。 在 第 二 个 例子 中 ， 命令 行 只 有 一 个 参数 ， 参 数 中 包括 嵌入 
的 空格 和 换行 符 。 


单 引号 


如 果 需 要 禁止 所 有 的 展开 ， 我 们 使 用 单 引号 。 以 下 例子 是 无 引用 ， 双 引号 ， 和 单 引号 的 比较 结果 : 


[me@linuxbox ~]$ echo text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER 
text /nome/me/ls-output.txt a bfoo 4 me 

[me@linuxbox ~]$ echo "text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER" 
text ~/*.txt {a,b} foo 4 me 

[me@linuxbox ~]$ echo text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER' 
text ~/*.txt {a,b} $(echo foo) $((2+2)) $USER 


正如 我 们 所 看 到 的 ， 随 着 引用 程度 加 强 ， 越 来 越 多 的 展开 被 禁止 。 


转 义 字符 


有 时 候 我 们 只 想 引 用 单个 字符 。 我 们 可 以 在 字符 之 前 加 上 一 个 反 斜 枉 ， 在 这 个 上 下 文中 叫做 转 义 字符 。 经 常 在 双 引 号 中 使 用 
转 义 字符 ， 来 有 选择 地 阻止 展开 。 


[me@linuxbox ~]$ echo "The balance for user $USER is: \$5.00" 
The balance for user me is: $5.00 


ti tea 是 很 普 表 的 。 例 如， 在 文件 名 中 可 能 使 用 一 些 对 于 shell 来 说 ， 有 特殊 
含义 的 字符 。 这 些 字符 包括 "$", ""," "等 字符 。 在 文件 名 中 包含 特殊 字符 ， 你 可 以 这 样 做 : 


[me@linuxbox ~]$ mv bad\&filename good filename 


为 了 人 允许 反 斜 杠 字符 出 现 ， 输 入 "\' 来 转 义 。 注 意 在 单 引 号 中 ， 反 和 斜 杠 失去 它 的 特殊 含义 ， 它 被 看 作 普 通 字 符 。 


反 斜 杠 转 义 字符 序列 








反 斜 杠 除 了 作为 转 义 字符 外 ， 反 和 斜 杠 也 是 一 种 表示 法 的 一 部 分 ， 这 种 表示 法 代表 某 种 特殊 字符 ， 叫 做 控制 码 。ASCIl 
编码 表 中 前 32 个 字符 被 用 来 把 命 倒转 输 到 像 电报 机 一 样 的 设备 。 一 些 编码 是 众所周知 的 〈 制 表 符 ， 退 格 符 ， 换 行 符 ， 
和 回 车 符 ) ， 其 它 一 些 编码 就 不 熟悉 了 〈 空 值 ， 传 输 结 束 码 ， 和 确认 ) 。 





转 义 序列 意思 

\a 响 铃 ("警告 "一 导致 计算 机 嘟 嘟 响 

\b 退 格 符 

\n 新 的 一 行 。 在 类 似 Unix 系统 中 ， 产 生 换行 。 
Vr 回 车 符 

vt 制 表 符 


上 表 列 出 了 一 些 常见 的 反 斜 杠 转 义 字符 。 反 和 斜 杠 表 示 法 背后 的 思想 来 源 于 C 编程 语言 ， 许多 其 它 语言 也 采用 了 这 种 表 
示 方 法 ， 包 括 shell。 





echo 命令 带 上 '"-e" 选 项 ， 能 够 解释 转 义 序列 。 你 可 以 把 转 义 序列 放 在 $'' 里 面 。 以 下 例子 ， 使 用 sleep 命令 ， 一 个 简单 
的 程序 ， 它 会 等 待 指定 的 秒 数 ， 然 后 退出 。 我 们 可 以 创建 一 个 简单 的 倒数 计数 器 : 


Sleep 10; echo -e "Time's upla”" 

我 们 也 可 以 这 样 做 : 

Sleep 10; echo "Time's up" $'\a’ 
总 结 轨 纳 


随 着 我 们 继续 学 习 shell， 你 会 发 现 使 用 展开 和 引用 的 频率 逐渐 多 起 来 ， 所 以 能 够 很 好 的 理解 他 们 的 工作 方式 很 有 意义 。 事 
实 上 ， 可 以 这 样 说 ， 他 们 是 学 习 shell 的 最 重要 的 主题 。 如 果 没 有 准确 地 理解 展开 模式 ，shell 总 是 神秘 和 混乱 的 源泉 ， 并 且 
shell 潜在 的 能 力也 浪费 掉 了 。 


拓展 阅读 
e Bash 手册 页 有 主要 段落 是 关于 展开 和 引用 的 ， 它 们 以 更 正式 的 方式 介绍 了 这 些 题目 。 


e Bash 参考 手册 也 包含 章节 ， 介 绍 展开 和 引用 : 


http:/www.gnu.org/software/bash/manual/bashref.html 


键 瘟 高 级 操作 技巧 


开玩笑 地 说 ， 我 经 常 把 Unix 描述 为 “这 个 操作 系统 是 为 喜欢 散 键 盘 的 人 们 服务 的 。” 当然 ，Unix 其 至 还 有 一 个 命 合 行 ， 这 个 
事实 是 个 确 当 的 证 据 ， 证 明了 我 所 说 的 话 。 但 是 命令 行 用 户 不 喜欢 融入 那么 多 字 。 那 又 为 什么 如 此 多 的 命令 会 有 这 样 简短 的 
命令 名 ， 像 cp，ls，mv， 和 rm? 事实 上 ， 命 合 行 最 为 珍视 的 目标 之 一 就 是 懒惰 ; 用 最 少 的 击 键 次 数 来 完成 最 多 的 工作 。 另 
一 个 目标 是 你 的 手指 永远 不 必 离 开 键 胡 ， 永 不 触摸 九 标 。 在 这 一 章节 ， 我 们 将 看 一 下 bash 特性 ， 这 些 特性 使 键盘 使 用 起 来 
更 加 迅速 ， 更 加 高 效 。 





以 下 命令 将 会 露面 : 
e clear 一 清空 屏幕 


e history 一 显示 历史 列表 内 容 


Bash 使 用 了 一 个 名 为 Readline 的 库 (共享 的 线程 集合 ， 可 以 被 不 同 的 程序 使 用 ) ， 来 实现 命令 行 编辑 。 我 们 已 经 看 到 一 些 
例子 。 我 们 知道 ， 例 如 ， 箭 头 按键 可 以 移动 鼠标 ， 此 外 还 有 许多 特性 。 想 想 这 些 额外 的 工具 ， 我 们 可 以 在 工作 中 使 用 。 学 会 
所 有 的 特性 并 不 重要 ， 但 许多 特性 非常 有 帮助 。 选 择 自己 需要 的 特性 。 


注意 : 下 面 一 些 按键 组 合 (尤其 使 用 Alt 键 的 组 合 ) ， 可 能 会 被 GUI 拦截 来 触发 其 它 的 功能 。 当 使 用 虚拟 控制 台 时 ， 所 有 的 
按键 组 合 都 应 该 正确 地 工作 。 


移动 光标 
下 表 列 出 了 移动 光标 所 使 用 的 按键 : 


表 9-1: 光标 移动 命令 


按键 行动 

Ctrl-a 移动 光标 到 行 首 。 

Ctrl-e 移动 光标 到 行 尾 。 

Ctrl-f 光标 前 移 一 个 字符 ; 和 右 箭头 作用 一 样 。 

Ctrl-b 光标 后 移 一 个 字符 ; 和 左 箭头 作用 一 样 。 

Alt-f 光标 前 移 一 个 字 。 

Alt-b 光标 后 移 一 个 字 。 

Ctrl-| 清空 屏幕 ， 移 动 光标 到 左上 角 。clear 命令 完成 同样 的 工作 。 

修改 文本 


表 9 一 2 列 出 了 键盘 命令 ， 这 些 命令 用 来 在 命令 行 中 编辑 字符 。 


按键 行动 
Ctrl-d 删除 光标 位 置 的 字符 。 
Ctrl-t 光标 位 置 的 字符 和 光标 前 面 的 字符 互 换 位 置 。 
Alt-t 光标 位 置 的 字 和 其 前 面 的 字 互 换 位 置 。 
Alt- 把 从 光标 位 置 到 字 尾 的 字符 转换 成 小 写字 母 。 
Alt-u 把 从 光标 位 置 到 字 尾 的 字符 转换 成 大 写字 母 。 


筋 切 和 粘贴 文本 


Readline 的 文档 使 用 术语 killing 和 yanking 来 指 我 们 平常 所 说 的 剪 切 和 粘贴 。 剪 切 下 来 的 本 文 被 存储 在 一 个 叫做 剪 切 环 
(kill-ring) 的 缓冲 区 中 。 


表 9-3: 剪 切 和 粘贴 命令 


按键 行动 
Ctrl-k 剪 切 从 光标 位 置 到 行 尾 的 文本 。 
Ctrl-u 剪 切 从 光标 位 置 到 行 首 的 文本 。 
Alt-d 剪 切 从 光标 位 置 到 词尾 的 文本 。 
Alt-Backspace 剪 切 从 光标 位 置 到 词 头 的 文本 。 如 果 光 标 在 一 个 单词 的 开头 ， 剪 切 前 一 个 单词 。 
Ctrl-y 把 剪 切 环 中 的 文本 粘贴 到 光标 位 置 。 


元 键 


如 果 你 冒险 进入 到 Readline 的 文档 中 ， 你 会 在 bash 手册 页 的 READLINE 段落 ， 遇 到 一 个 术语 "元 键 " (meta 
key) 。 在 当今 的 键盘 上 ， 这 个 元 键 是 指 Alt 键 ， 但 并 不 总 是 这 样 。 





回 到 苦 暗 的 年 代 (在 PC 之 前 Unix 之 后 ) ， 并 不 是 每 个 人 都 有 他 们 自己 的 计算 机 。 他 们 可 能 有 一 个 叫做 终端 的 设备 。 
一 个 终端 是 一 种 通信 设备 ， 它 以 一 个 文本 显示 屏幕 和 一 个 键盘 作为 其 特色 ， 它 里 面 有 足够 的 电子 器 件 来 显示 文本 字符 
和 移动 光标 。 它 连 接 到 (通常 通过 串 行 电 绕 ) 一 个 更 大 的 计算 机 或 者 是 一 个 大 型 计算 机 的 通信 网 络 。 有 许多 不 同 的 终 
端 产 品 商标 ， 它 们 有 着 不 同 的 键 瘟 和 特征 显示 集 。 因 为 它们 都 倾向 于 至 少 能 理解 ASCll， 所 以 软件 开发 者 想 要 符合 最 
低 标准 的 可 移植 的 应 用 程序 。 Unix 系统 有 一 个 非常 精巧 的 方法 来 处 理 各 种 终端 产品 和 它们 不 同 的 显示 特征 。 因 为 
Readline 程序 的 开发 者 们 ， 不 能 确定 一 个 专用 多 余 的 控制 键 的 存在 ， 他 们 发 明了 一 个 控制 键 ， 并 把 它 叫 









































做 "元 " ("meta") 。 然 而 在 现代 的 键 瘟 上 ，Alt 键 作 为 元 键 来 服务 。 如 果 你 仍然 在 使 用 终端 (在 Linux 中 ， 你 仍然 可 以 
得 到 一 个 终端 ) ， 你 也 可 以 按 下 和 释放 Esc 键 来 得 到 如 控制 Alt 键 一 样 的 效果 。 
自动 补 全 


shell 能 帮助 你 的 另 一 种 方式 是 通过 一 种 叫做 自动 补 全 的 机 制 。 当 你 敲 入 一 个 命令 时 ， 按 下 tab 键 ， 自 动 补 全 就 会 发 生 。 让 我 
们 看 一 下 这 是 怎样 工作 的 。 给 出 一 个 看 起 来 像 这 样 的 主 目录 : 


[me@linuxbox ~]$ ls 
Desktop ls-output.txt Pictures Templates Videos 


试 着 输入 下 面 的 命令， 但 不 要 按 下 Enter 键 : 


[me@linuxbox ~]$ Is 1 


现在 按 下 tab 键 : 


[me@linuxbox ~]$ ls ls-output.txt 


看 一 下 shell 是 怎样 补 全 这 一 行 的 ? 让 我 们 再 试 试 另 一 个 例子 。 这 回 ， 也 不 要 按 下 Enter: 


[me@linuxbox ~]$ Is D 


按 下 tab: 


[me@linuxbox ~]$ Is D 


没有 补 全 ， 只 是 嘟 嘟 响 。 因 为 "D" 不 止 匹 配 目录 中 的 一 个 条 目 。 为 了 自动 补 全 执行 成 功 ， 你 给 它 的 "线索 "必须 不 模 校 两 可 。 如 
果 我 们 继续 输入 : 


[me@linuxbox ~]$ ls Do 


然后 按 下 tab : 


[me@linuxbox ~]$ ls Documents 


自动 补 全 成 功 了 。 

这 个 实例 展示 了 路 径 名 自动 补 全 ， 这 是 最 常用 的 形式 。 自 动 补 全 也 能 对 变量 起 作用 (如 果 字 的 开头 是 一 个 "$") ， 用 户 名 字 
(单词 以 "~ "开始 ) ， 命 令 (如 果 单 词 是 一 行 的 第 一 个 单词 ) ， 和 主机 名 (如 果 单 词 的 开头 是 "@") 。 主 机 名 自动 补 全 只 对 包 

含 在 文件 /etc/hosts 中 的 主机 名 有 效 。 

有 一 系列 的 控制 和 元 键 序列 与 自动 补 全 相关 联 : 


表 9-4: 自动 补 全 命令 


按键 行动 
显示 可 能 的 自动 补 全 列表 。 在 大 多 数 系统 中 ， 你 也 可 以 完成 这 个 通过 按 两 次 tab 键 ， 这 
A 会 更 容易 些 。 
Alt-* 插入 所 有 可 能 的 自动 补 全 。 当 你 想 要 使 用 多 个 可 能 的 匹配 项 时 ， 这 个 很 有 帮助。 
可 编程 自动 补 全 








目前 的 bash 版 本 有 一 个 叫做 可 编程 自动 补 全 工具 。 可 编程 自动 补 全 人 允许 你 (更 可 能 是 ， 你 的 发 行 版 提供 商 ) 来 加 入 
额外 的 自动 补 全 规则 。 通 常 需要 加 入 对 特定 应 用 程序 的 支持 ， 来 完成 这 个 任务 。 例 如 ， 有 可 能 为 一 个 命令 的 选项 列 

表 ， 或 者 一 个 应 用 程序 支持 的 特殊 文件 类 型 加 入 自动 补 全 。 默认 情况 下 ，Ubuntu 已 经 定义 了 一 个 相当 大 的 规则 集 

合 。 可 编程 自动 补 全 是 由 shell 函数 实现 的 ， shell 函数 是 一 种 小 巧 的 shell 脚本 ， 我 们 会 在 后 面 的 章节 中 讨论 到 。 如 
果 你 感到 好 奇 ， 试 一 下 : 














set|less 





查看 一 下 如 果 你 能 找到 它们 的 话 。 默 认 情 况 下 ， 并 不 是 所 有 的 发 行 版 都 包括 它们 。 


利用 历史 命 命 


正如 我 们 在 第 二 章 中 讨论 到 的 ，bash 维护 着 一 个 已 经 执行 过 的 命令 的 历史 列表 。 这 个 命令 列表 被 保存 在 你 主 目录 下 ， 一 个 
叫做 .bash_history 的 文件 里 。 这 个 history 工具 是 个 有 用 资源 ， 因为 它 可 以 减少 你 禹 键盘 的 次 数 ， 尤 其 当 和 命令 行 编辑 联系 
起 来 时 。 





搜索 历史 命令 


在 任何 时 候 ， 我 们 都 可 以 浏览 历史 列表 的 内 容 ， 通 过 : 
[me@linuxbox ~]$ history | less 


在 默认 情况 下 ，bash 会 存储 你 所 输入 的 最 后 500 个 命令 。 在 随后 的 章节 里 ， 我 们 会 知道 怎样 调整 这 个 数值 。 比 方 说 我 们 想 
要 找到 列 出 目录 /usrbin 内 容 的 命令 。 一 种 方法 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ history | grep /usr/bin 


比方 说 在 我 们 的 搜索 结果 之 中 ， 我 们 得 到 一 行 ， 包 含 了 有 趣 的 命令 ， 像 这 样 
88 ls -| /usr/bin > ls-output.txt 


数字 "88" 是 这 个 命令 在 历史 列表 中 的 行 号 。 随 后 在 使 用 另 一 种 展开 类 型 时 ， 叫 做 历史 命令 展开 ， 我 们 会 用 到 这 个 数字 。 我 们 
可 以 这 样 做 ， 来 使 用 我 们 所 发 现 的 行 : 


[me@linuxbox ~]$ !88 


bash 会 把 "88" 展开 成 为 历史 列表 中 88 行 的 内 容 。 还 有 其 它 的 历史 命令 展开 形式 ， 我 们 一 会 儿 讨论 它们 。bash 也 具有 按 递 
增 顺 序 来 搜索 历史 列表 的 能 力 。 这 意味 着 随 着 字符 的 输入 ， 我 们 可 以 告诉 bash 去 搜索 历史 列表 ， 每 一 个 附加 字符 都 进一步 
提炼 我 们 的 搜索 。 启 动 递增 搜索 ， 输 入 Ctrl-r， 其 后 输入 你 要 寻找 的 文本 。 当 你 找到 它 以 后 ， 你 可 以 敲 入 Enter 来 执行 命 
令 ， 或 者 输入 Ctrl-j， 从 历史 列表 中 复制 这 一 行 到 当前 命令 行 。 再 次 输入 Ctrl-r， 来 找到 下 一 个 匹配 项 (向 上 移动 历史 列 
表 ) 。 输 入 Ctrl-g 或 者 Ctrl-c， 退 出 搜索 。 实 际 来 体验 一 下 : 


[me@linuxbox ~]$ 


首先 输入 Ctrl-r: 


(reverse-i-search) 


提示 符 改 变 ， 显 示 我 们 正在 执行 反 向 递增 搜索 。 搜 索 过 程 是 " 反 向 的 "， 因 为 我 们 按照 从 "现在 "到 过 去 某 个 时 间 段 的 顺序 来 搜 
寻 。 下 一 步 ， 我 们 开始 输入 要 查找 的 文本 。 在 这 个 例子 里 是 "/usr/bin" : 


(reverse-i-search) /usr/bin': |s -| /usr/bin > ls-output.txt 


即刻 ， 搜 索 返 回 我 们 需要 的 结果 。 我 们 可 以 执行 这 个 命令 ， 按 下 Enter 键 ， 或 者 我 们 可 以 复制 这 个 命令 到 我 们 当前 的 命令 
行 ， 来 进一步 编辑 它 ， 输 入 Ctrl-j。 复 制 它 ， 输 入 Ctrl-j : 


[me@linuxbox ~]$ Is -| /usr/bin > ls-output.txt 


我 们 的 shell 提示 符 重 新 出 现 ， 命 令 行 加载 完 毕 ， 正 准备 行动 ! 下 表 列 出 了 一 些 按键 组 合 ， 这 些 按键 用 来 操作 历史 列表 : 


表 9-5: 历史 命令 


按键 行为 
Ctrl-p 移动 到 上 一 个 历史 条 目 。 类 似 于 上 箭头 按键 。 
Ctrl-n 移动 到 下 一 个 历史 条 目 。 类 似 于 下 箭头 按键 。 
Alt-< 移动 到 历史 列表 开头 。 
Alt-> 移动 到 历史 列表 结尾 ， 即 当前 命 邻 行 。 
Ctrl-r 反 向 递增 搜索 。 从 当前 命令 行 开始 ， 向 上 递增 搜索 。 
Alt-p 反 向 搜索 ， 不 是 递增 顺序 。 输 入 要 查找 的 字符 串 ， 然 后 按 下 Enter， 执 行 搜索 。 
Alt-n 向 前 搜索 ， 非 递增 顺序 。 


人 执行 历史 列表 中 的 当前 项 ， 并 移 到 下 一 个 。 如 果 你 想 要 执行 历史 列表 中 一 系列 的 命 全 ， 
这 很 方便 。 


通过 使 用 " 字符 ，shell 为 历史 列表 中 的 命令 ， 提 供 了 一 个 特殊 的 展开 类 型 。 我 们 已 经 知道 一 个 感叹 号 ， 其 后 再 加 上 一 个 数 
字 ， 可 以 把 来 自 历史 列表 中 的 命令 插入 到 命令 行 中 。 还 有 一 些 其 它 的 展开 特性 : 


表 9-6: 历史 展开 命令 


序列 行为 
1 重复 最 后 一 次 执行 的 命令 。 可 能 按 下 上 箭头 按键 和 enter 键 更 容易 些 。 
Inumber 重复 历史 列表 中 第 number 行 的 命令 。 
Istring 重复 最 近 历 史 列 表 中 ， 以 这 个 字符 串 开 头 的 命令 。 
I?string 重复 最 近 历 史 列 表 中 ， 包 含 这 个 字符 串 的 命 合 。 


应 该 小 心 着 慎 地 使 用 "Istring" 和 "I?string" 格式 ， 除 非 你 完全 确信 历史 列表 条 目的 内 容 。 


在 历史 展开 机 制 中 ， 还 有 许多 可 利用 的 特点 ， 但 是 这 个 题目 已 经 太 星 梁 难 懂 了 ， 如 果 我 们 再 继续 讨论 的 话 ， 我 们 的 头 可 能 要 
爆炸 了 。bash 手册 页 的 HISTORY EXPANSION 部 分 详尽 地 讲述 了 所 有 要 素 。 


脚本 





除了 bash 中 的 命令 历史 特性 ， 许 多 Linux 发 行 版 包括 一 个 叫做 script 的 程序 ， 这 个 程序 可 以 记录 整个 shell 会 话 ， 并 
把 shell 会 话 存在 一 个 文件 里 面 。 这 个 命令 的 基本 语法 是 : 

















Script [file] 
命令 中 的 file 是 指 用 来 存储 shell 会 话 记录 的 文件 名 。 如 果 没 有 指定 文件 名 ， 则 使 用 文件 typescript。 查看 脚本 的 手册 


tH 0 


页 ， 可 以 得 到 一 个 关于 script 程序 选项 和 特点 的 完整 列表 。 

总 结 为 纳 

在 这 一 章 中 ， 我 们 已 经 讨论 了 一 些 由 shell 提供 的 键盘 操作 技巧 ， 这 些 技巧 是 来 帮助 打字 员 减 少 工作 量 的 。 随 着 时 光 流 逝 ， 
你 和 命 合 行 打交道 越 来 越 多 ， 我 猜想 你 会 重新 翻阅 这 一 章 的 内 容 ， 学 会 更 多 的 技巧 。 目前 ， 你 就 认为 它们 是 可 选 的 ， 潜 在 地 
有 帮助 的 。 

拓展 阅读 

e Wikipedia 上 有 一 篇 关于 计算 机 终端 的 好 文章 : 


http:/en.wikipedia.orgWikMComputer_terminal 


权限 


Unix 传统 中 的 操作 系统 不 同 于 那些 MS-DOS 传统 中 的 系统 ， 区 别 在 于 它们 不 仅 是 多 任务 系统 ， 而 且 也 是 多 用 户 系统 。 这 到 
底 意 味 着 什么 ? 它 意 味 着 多 个 用 户 可 以 在 同一 时 间 使 用 同一 台 计 算 机 。 然 而 一 个 典型 的 计算 机 可 能 只 有 一 个 键盘 和 一 个 监视 
器 ， 但 是 它 仍然 可 以 被 多 个 用 户 使 用 。 例 如 ， 如 果 一 台 计算 机 连接 到 一 个 网 络 或 者 因特网 ， 那 么 远程 用 户 通过 ssh (安全 
shell) 可 以 登录 并 操纵 这 台电 脑 。 事实 上 ， 远 程 用 户 也 能 运行 图 形 界面 应 用 程序 ， 并 且 图 形 化 的 输出 结果 会 出 现在 远 端的 显 
示 器 上 。 X 窗口 系统 把 这 个 作为 基本 设计 理念 的 一 部 分 ， 并 支持 这 种 功能 。 


Linux 系统 的 多 用 户 性 能 ， 不 是 最 近 的 “创新 ”， 而 是 一 种 特性 ， 它 深 深 地 嵌入 到 了 Linux 操作 系统 的 设计 过 程 中 。 想 一 下 
Unix 系统 的 诞生 环境 ， 这 会 很 有 意义 。 多 年 前 ， 在 个 人 电脑 出 现 之 前 ， 计 算 机 都 是 大 型 的 ， 昂 贵 的 ， 集 中 化 的 。 一 个 典型 的 
大 学 计算 机 系统 ， 例 如 ， 是 由 坐落 在 一 座 建 筑 中 的 一 台 大 型 中 央 计算 机 和 许多 散布 在 校园 各 处 的 终端 机 组 成 ， 每 个 终端 都 连 
接 到 这 台大 型 中 央 计 算 机 。 这 台 计 算 机 可 以 同时 支持 很 多 用 户 。 


为 了 使 多 用 户 特性 付 诸 实践 ， 那 么 必须 发 明 一 种 方法 来 阻止 用 户 彼此 之 间 受 到 影响 。 毕 竟 ， 一 个 用 户 的 行为 不 能 导致 计算 机 
崩溃 ， 也 不 能 乱 动 属于 另 一 个 用 户 的 文件 。 





在 这 一 章 中 ， 我 们 将 看 看 这 一 系统 安全 的 重要 组 成 部 分 ， 会 介绍 以 下 命令 : 
eid 一 显示 用 户 身份 号 

e。 chmod 一 更 改 文件 模式 

e umask - 设置 默认 的 文件 权限 

e SU 一 以 另 一 个 用 户 的 身份 来 运行 shel 

e Sudo - 以 另 一 个 用 户 的 身份 来 执行 命令 

e chown 一 更改 文件 所 有 者 

e chgrp 一 更改 文件 组 所 有 权 


e。 passwd 一 更 改 用 户 密码 


拥有 者 ， 组 成 员 ， 和 其 他 人 


在 第 四 章 探究 文件 系统 时 ， 当 我 们 试图 查看 一 个 像 /etc/shadow 那样 的 文件 的 时 候 ， 我 们 会 遇 到 一 个 问题 。 


[me@linuxbox ~]$ file /etc/shadow 
/etc/shadow: regular file, no read permission 
[me@linuxbox ~]$ less /etc/shadow 
/etc/shadow: Permission denied 


产生 这 种 错误 信息 的 原因 是 ， 作 为 一 个 普通 用 户 ， 我 们 没有 权限 来 读 取 这 个 文件 。 





在 Unix 安全 模型 中 ， 一 个 用 户 可 能 拥有 文件 和 目录 。 当 一 个 用 户 拥有 一 个 文件 或 目录 时 ， 用 户 对 这 个 文件 或 目录 的 访问 权 
限 拥有 控制 权 。 用 户 ， 反 过 来 ， 又 属于 一 个 由 一 个 或 多 个 用 户 组 成 的 用 户 组 ， 用 户 组 成 员 由 文件 和 目录 的 所 有 者 授予 对 文件 
和 目录 的 访问 权限 。 除 了 对 一 个 用 户 组 授予 权限 之 外 ， 文 件 所 有 者 可 能 会 给 每 个 人 一 些 权限 ， 在 Unix 术语 中 ， 每 个 人 是 指 
整个 世界 。 可 以 用 id 命 舍 ， 来 找到 关于 你 自己 身份 的 信息 : 





[me@linuxbox ~]$ id 
uid=500(me) gid=500(me) groups=500(me) 


让 我 们 看 一 下 输出 结果 。 当 用 户 创建 帐户 之 后 ， 系 统 会 给 用 户 分 配 一 个 号 码 ， 叫 做 用 户 ID 或 者 uid， 然 后 ， 为 了 符合 人 类 的 
习惯 ， 这 个 ID 映射 到 一 个 用 户 名 。 系 统 又 会 给 这 个 用 户 分 配 一 个 原始 的 组 ID 或 者 是 gid， 这 个 gid 可 能 属于 另外 的 组 。 上 
面 的 例子 来 自 于 Fedora 系统 ， 比方 说 Ubuntu 的 输出 结果 可 能 看 起 来 有 点 儿 不 同 : 





[me@linuxbox ~]$ id 

uid=1000(me) gid=1000(me) 
groups=4(adm),20(dialout),24(cdrom),25(floppy),29(audio),30(dip),44(v 
ideo),46(plugdev),108(lpadmin),114(admin),1000(me) 


正如 我 们 能 看 到 的 ， 两 个 系统 中 用 户 的 uid 和 gid 号 码 是 不 同 的 。 原 因 很 简单 ， 因 为 Fedora 系统 从 500 开 始 进 行 普通 用 户 帐 
户 的 编号 ， 而 Ubuntu 从 1000 开 始 。 我 们 也 能 看 到 Ubuntu 的 用 户 属于 更 多 的 用 户 组 。 这 和 Ubuntu 管理 系统 设备 和 服务 权 
限 的 方式 有 关系 。 


那么 这 些 信 息 来 源 于 哪里 呢 ? 像 Linux 系统 中 的 许多 东西 一 样 ， 来 自 一 系列 的 文本 文件 。 用 户 帐户 定义 在 /etc/passwd 文件 
里 面 ， 用 户 组 定义 在 /etc/group 文件 里 面 。 当 用 户 帐户 和 用 户 组 创建 以 后 ， 这 些 文件 随 着 文件 /etc/shadow 的 变动 而 修改 ， 
文件 /etc/shadow 包含 了 关于 用 户 密码 的 信息 。 对 于 每 个 用 户 帐号 ， 文 件 /etc/passwd 定义 了 用 户 (登录 ) 名 ，uid，gid， 
帐号 的 真实 姓名 ， 主 目录 ， 和 登录 shell。 如 果 你 查看 一 下 文件 /etc/passwd 和 文件 /etc/group 的 内 容 ， 你 会 注意 到 除了 普通 
用 户 帐号 之 外 ， 还 有 超级 用 户 (uid 0) 帐号 ， 和 各 种 各 样 的 系统 用 户 。 


在 下 一 章 中 ， 当 我 们 讨论 进程 时 ， 你 会 知道 这 些 其 他 的 "用户 " 是 谁 ， 实 际 上 ， 他 们 相当 忙碌 。 


然而 许多 像 Unix 的 系统 会 把 普通 用 户 分 配 到 一 个 公共 的 用 户 组 中 ， 例 如 “users"， 现 在 的 Linux 会 创建 一 个 独一无二 的 ， 只 
有 一 个 成 员 的 用 户 组 ， 这 个 用 户 组 与 用 户 同名 。 这 样 使 某 种 类 型 的 权限 分 配 更 容易 些 。 


读 取 ， 写 人 ， 和 执行 


对 于 文件 和 目录 的 访问 权力 是 根据 读 访问 ， 写 访问 ， 和 执行 访问 来 定义 的 。 如 果 我 们 看 一 下 |s 命令 的 输出 结果 ， 我 们 能 得 到 
一 些 线索 ， 这 是 怎样 实现 的 : 


[me@linuxbox ~]$ > foo.txt 
[me@linuxbox ~]$ Is -| foo.txt 
-rwW-rw-r-- 1 me me 0 2008-03-06 14:52 foo.txt 





列表 的 前 十 个 字符 是 文件 的 属性 。 这 十 个 字符 的 第 一 个 字符 表明 文件 类 型 。 下 表 是 你 可 能 经 常 看 到 的 文件 类 型 (还 有 其 它 
的 ， 不 常见 类 型 ) 


表 10-1: 文件 类 型 
属性 文件 类 型 
一 个 普通 文件 
d 一 个 目录 


一 个 符号 链接 。 注 意 对 于 符号 链接 文件 ， 剩 余 的 文件 属性 总 是 "rwxrwxrwx"， 而 且 都 是 虚拟 值 。 真 正 
的 文件 属性 是 指 符号 链接 所 指向 的 文件 的 属性 。 


& a 这 种 文件 类 型 是 指 按照 字 节 流 ， 来 人 处理 数据 的 设备 。 比如 说 终端 机 ， 或 者 调制 
备 调 器 


一 个 块 设备 文件 。 这 种 文件 类 型 是 指 按照 数据 块 ， 来 处 理 数据 的 设备 ， 例 如 一 个 硬盘 ， 或 者 CD- 
ROM 部 。 


剩 下 的 九 个 字符 ， 叫 做 文件 模式 ， 代 表 着 文件 所 有 者 ， 文 件 组 所 有 者 ， 和 其 他 人 的 读 ， 写 ， 执 行 权 限 。 





当 设 置 文件 模式 后 ，r，w，x 模式 属性 对 文件 和 目录 会 产生 以 下 影响 : 


chmod 一 更 改 文件 模式 


更 改 文件 或 目录 的 模式 〈 权 限 ) ， 可 以 利用 chmod 命令 。 注 意 只 有 文件 的 所 有 者 或 者 超级 用 户 才 能 更 改 文件 或 目录 的 模 
式 。chmod 命令 支持 两 种 不 同 的 方法 来 改变 文件 模式 : 八进制 数字 表示 法 ， 或 符号 表示 法 。 首 先 我 们 讨论 一 下 八进制 数字 表 
示 法 。 


八进制 (以 8 为 基数 ) ， 和 她 的 亲 威 ， 十 六 进 制 (以 16 为 基数 ) 都 是 数字 系统 ， 通 常 被 用 来 表示 计算 机 中 的 数字 。 我 
们 人 类 ， 因 为 这 个 事实 (或 者 至 少 大 多 数 人 ) 天 生 具 有 十 个 手指 ， 利 用 以 10 为 基数 的 数字 系统 来 计数 。 计 算 机 ， 从 另 
一 方面 讲 ， 生 来 只 有 一 个 手指 ， 因 此 它 以 二 进 制 ( 以 2 为 基数 ) 来 计数 。 它 们 的 数字 系统 只 有 两 个 数值 ，0 和 1。 因此 
在 二 进 制 中 ， 计 数 看 起 来 像 这 样 : 





0, 1, 10, 11, 100, 101, 110, 111, 1000, 1001, 1010, 1011... 
在 八进制 中 ， 着 八 进 一 ， 用 数字 0 到 7 来 计数 ， 像 这 样 : 

0, 1, 2, 3, 4, 5, 6,7, 10, 11, 12, 13, 14, 15, 16, 17, 20, 21... 

十 六 进 制 中 ， 使 用 数字 0 到 9， 加 上 大 写字 母 "A'" 到 "F'" 来 计数 ， 着 16 进 一 

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, 10, 11, 12, 13... 

虽然 我 们 能 知道 二 进 制 的 意义 (因为 计算 机 只 有 一 个 手指 ) ， 但 是 八进制 和 十 六 进 制 有 什么 用 处 呢 ? 答案 是 为 了 人 类 
的 便利 。 许 多 时 候 ， 在 计算 机 中 ， 一 小 部 分 数据 以 二 an 以 RGB 颜色 为 例 来 说 明 。 大 多 数 的 计算 机 显 
示 器 ， 每 个 像素 由 三 种 颜色 组 成 : 8 位 红色 ，8 位 绿色 ， 8 位 蓝 色 。 这 样 ， 一 种 可 爱 的 中 蓝 色 就 由 24 位 数字 来 表示 : 


010000110110111111001101 


我 不 认为 你 每 天 都 喜欢 读 写 这 类 数字 。 另 一 种 数字 系统 对 我 们 更 有 帮助 。 Ol 数字 代表 四 个 二 进 制 。 在 八 进 
制 中 ， 每 个 数字 代表 三 个 二 进 制 数字 。 那 么 代表 中 茧 色 的 24 位 二 进 制 能 够 压缩 成 6 位 十 六 进 制 数 : 


436FCD 


因为 十 六 进 制 中 的 两 个 数字 对 应 二 进 制 的 8 位 数字 ， 我 们 可 以 看 到 ”43 代表 红色 ,， “6F" 代表 绿色 , “CD" 代 表 蓝 色 。 





现在 ， 十 六 进 制 表示 法 (经常 叫做 ‘hex”) 比 八 进 制 更 普 青 ， 但 是 我 们 很 快 会 看 到 ， 用 八进制 来 表示 3 个 二 进 制 数 非常 
< 


通过 八进制 表示 法 ， 我 们 使 用 八进制 数字 来 设置 所 期 望 的 权限 模式 。 因 为 每 个 八进制 数字 代表 了 3 个 二 进 制 数 字 ， 这 种 对 应 
关系 ， 正 好 映射 到 用 来 存储 文件 模式 所 使 用 的 方案 上 。 下 表 展 示 了 我 们 所 要 表达 的 意思 : 


Octal Binary File Mode 

0 000 

1 001 --X 

2 010 -W- 

3 011 -WX 

4 100 fa 

5 101 r-x 

6 110 rwW- 

7 111 rwWx 


通过 使 用 3 个 八进制 数字 ， 我 们 能 够 设置 文件 所 有 者 ， 用 户 组 ， 和 其 他 人 的 权限 : 


[me@linuxbox ~]$ > foo.txt 

[me@linuxbox ~]$ Is -| foo.txt 

-rwW-rw-r--1 me me 0 2008-03-06 14:52 foo.txt 
[me@linuxbox ~]$ chmod 600 foo.txt 
[me@linuxbox ~]$ Is -| foo.txt 

-FTW------- lme me 0 2008-03-06 14:52 foo.txt 


通过 传递 参数 “600”， 我 们 能 够 设置 文件 所 有 者 的 权限 为 读 写 权 限 ， 而 删除 用 户 组 和 其 他 人 的 所 有 权限 。 虽 然 八 进 制 到 二 进 
制 的 映射 看 起 来 不 方便 ， 但 通常 只 会 用 到 一 些 常见 的 映射 关系 : 7 (rwx)，6 (rw-)，5 (r-x)，4 (r--)，and 0 (---)。 


chmod 命令 支持 一 种 符号 表示 法 ， 来 指定 文件 模式 。 符 号 表示 法 分 为 三 部 分 : 更 改 会 影响 谁 ， 要 执行 哪个 操作 ， 要 设置 哪 种 
权限 。 通 过 字符 “u”"”，“g”，“0”，and "a" 的 组 合 来 指定 要 影响 的 对 象 ， 如 下 所 示 : 


表 10-4: chmod 命令 符号 表示 法 


U “user" 的 简写 ， 意 思 是 文件 或 目录 的 所 有 者 。 
g 用 户 组 。 

0 “others” 的 简写 ， 意 思 是 其 他 所 有 的 人 。 

a “all" 的 简写 ， 是 *u”"”，“g”， 和 “0” 三 者 的 联合 。 


如 果 没 有 指定 字符 ， 则 假定 使 用 "all"。 执 行 的 操作 可 能 是 一 个 “十 "字符 ， 表 示 加 上 一 个 权限 ， 一 个 "一 ”， 表 示 删 掉 一 个 权限 ， 
或 者 是 一 个 "="， 表 示 只 有 指定 的 权限 可 用 ， 其 它 所 有 的 权限 被 删除 。 


权限 由 “r”, “w”, and “xX” 来 指定 。 这 里 是 一 些 符号 表示 法 的 实例 : 


表 10-5: chmod 符号 表示 法 实例 


U+X 为 文件 所 有 者 添加 可 执行 权限 。 

U-X 删除 文件 所 有 者 的 可 执行 权限 。 

+X 为 文件 所 有 者 ， 用 户 组 ， 和 其 他 所 有 人 添加 可 执行 权限 。 等 价 于 a+x。 
o-rw 除了 文件 所 有 者 和 用 户 组 ， 删 除 其 他 人 的 读 权限 和 写 权 限 。 


2 给 群 组 的 主人 和 任意 文件 拥有 者 的 人 读 宇 权限 。 如 果 群 组 的 主人 或 全 局 之 前 已 经 有 了 执行 的 权限 ， 他 
go 们 将 被 移 除 。 


U+X,go=rw 给 文件 拥有 者 执行 权限 并 给 组 和 其 他 人 读 和 执行 的 权限 。 多 种 设 定 可 以 用 逗号 分 开 。 





一 些 人 喜欢 使 用 八进制 表示 法 ， 而 另 些 人 真正 地 喜欢 符号 表示 法 。 符 号 表示 法 的 优点 是 ， 允许 你 设置 文件 模式 的 单个 组 成 部 
分 的 属性 ， 而 没有 影响 其 他 的 部 分 。 


看 一 下 chmod 命令 的 手册 页 ， 可 以 得 到 更 详尽 的 信息 和 chmod 命令 的 各 个 选项 。 要 注意 “--recursive" 选项 : 它 可 以 同时 作 
用 于 文件 和 目录 ， 所 以 它 并 不 是 如 我 们 期 望 的 那么 有 用 处 ， 因 为 我 们 很 少 希 望 文件 和 目录 拥有 同样 的 权限 。 





借助 GUI 来 设置 文件 模式 


现在 我 们 已 经 知道 了 怎样 设置 文件 和 目录 的 权限 ， 这 样 我 们 就 可 以 更 好 的 理解 GUI 中 的 设置 权限 对 话 框 。 在 Nautilus 
(GNOME) 和 Konqueror (KDE) 中 ， 右 击 一 个 文件 或 目录 图 标 将 会 弹出 一 个 属性 对 话 框 。 下 面 这 个 例子 来 自 KDE 3.5 : 








El Properties forpws-read- '? 加 | X 
Permissions 


Access Permissions 





Owner | 


Group: | Forbidden 蕊 
Others: Forbidden 








区 Is executable 


Advanced Permissions 


Ownership 








User: bshotts 
Group: bshotts 





图 2: KDE 3.5 文件 属性 对 话 框 


从 这 个 对 话 框 中 ， 我 们 看 到 可 以 设置 文件 所 有 者 ， 用 户 组 ， 和 其 他 人 的 访问 权限 。 在 KDE 中 ， 右 击 "Advanced 
Permissions" 按 钮 ， 会 打开 另 一 个 对 话 框 ， 这 个 对 话 框 允许 你 单独 设置 各 个 模式 属性 。 这 也 可 以 通过 命令 行 来 理解 ! 


umask 一 设置 默认 权限 


当 创 建 一 个 文件 时 ，umask 命令 控 制 着 文件 的 默认 权限 。umask 命令 使 用 八进制 表示 法 来 表达 从 文件 模式 属性 中 删除 一 个 
位 掩 码 。 大 家 看 下 面 的 例子 : 


[me@linuxbox ~]$ rm -ffoo.txt 

[me@linuxbox ~]$ umask 

0002 

[me@linuxbox ~]$ > foo.txt 

[me@linuxbox ~]$ Is -| foo.txt 

-rwW-rw-r-- 1 me me 0 2008-03-06 14:53 foo.txt 


首先 ， 删 除 文件 foo.txt， 以 此 确定 我 们 从 新 开始 。 下 一 步 ， 运 行 不 带 参 数 的 umask 命令 ， 看 一 下 当前 的 掩 码 值 。 响 应 的 数 
值 是 0002 (0022 是 另 一 个 常用 值 ) ， 这 个 数值 是 掩 码 的 八进制 表示 形式 。 下 一 步 ， 我 们 创建 文件 foo.txt， 并 且 保 留 它 的 权 
限 。 


我 们 可 以 看 到 文件 所 有 者 和 用 户 组 都 得 到 读 权 限 和 写 权 限 ， 而 其 他 人 只 是 得 到 读 权限 。 其 他 人 没有 得 到 写 权 限 的 原因 是 由 掩 
码 值 决 定 的 。 重 复 我 们 的 实验 ， 这 次 自己 设置 掩 码 值 : 


[me@linuxbox ~]$ rm foo.txt 
[me@linuxbox ~]$ umask 0000 
[me@linuxbox ~]$ > foo.txt 
[me@linuxbox ~]$ Is -| foo.txt 


-rw-rw-rw-1 me me 0 2008-03-06 14:58 foo.txt 


当 掩 码 设 证 为 0000 (实质 上 是 关 掉 它 ) 之 后 ， 我 们 看 到 其 他 人 能 够 读 写 文件 。 为 了 弄 明白 这 是 怎么 回 事 ， 我 们 需要 看 一 下 掩 
码 的 八进制 形式 。 把 掩 码 展 开 成 二 进 制 形 式 ， 然 后 与 文件 属性 相 比 较 ， 看 看 有 什么 区 别 : 


Original file mode --- rw- rw- rw- 
Mask 000 000 000 010 


Result --- TW- rw- r-- 
此 刻 先 忽略 掉 开 头 的 三 个 雳 (我 们 一 会 儿 再 讨论 ) ， 注 意 掩 码 中 若 出现 一 个 数字 1， 则 删除 文件 模式 中 和 这 个 1 在 相同 位 置 的 


属性 ， 在 这 是 指 其 他 人 的 写 权 限 。 这 就 是 掩 码 要 完成 的 任务 。 掩 码 的 二 进 制 形式 中 ， 出 现 数字 1 的 位 置 ， 相 应 地 关 掉 一 个 文 
件 模式 属性 。 看 一 下 掩 码 0022 的 作用 : 


Original file mode --- fw- rw- rw- 
Mask 000 000 010 010 
Result --- rwW- f-- r-- 


又 一 次 ， 二 进 制 中 数字 1 出 现 的 位 置 ， 相 对 应 的 属性 被 删除 。 再 试 一 下 其 它 的 掩 码 值 〈 一 些 带 数字 7 的 ) ， 习 惯 于 掩 码 的 工作 
原理 。 当 你 实验 完成 之 后 ， 要 记得 清理 现场 : 


[me@linuxbox ~]$ rm foo.txt; umask 0002 


大 多 数 情 况 下 ， 你 不 必修 改 掩 码 值 ， 系 统 提供 的 默认 掩 码 值 就 很 好 了 。 然 而 ， 在 一 些 高 安全 级 别 下 ， 你 要 能 控制 掩 码 值 。 
一 些 特殊 权限 


虽然 我 们 通常 看 到 一 个 八进制 的 权限 掩 码 用 三 位 数字 来 表示 ， 但 是 从 技术 层面 上 来 讲 ， 用 四 位 数字 来 表示 它 更 确切 
些 。 为 什么 呢 ? 因为 ， 除 了 读 取 ， 写 入 ， 和 执行 权限 之 外 ， 还 有 其 它 的 ， 较 少 用 到 的 权限 设置 。 





其 中 之 一 是 setuid 位 (八进制 4000)。 当 应 用 到 一 个 可 执行 文件 时 ， 它 把 有 效用 户 ID 从 真正 的 用 户 (实际 运行 程序 的 
用 户 ) 设置 成 程序 所 有 者 的 ID。 这 种 操作 通常 会 应 用 到 一 些 由 超级 用 户 所 拥有 的 程序 。 当 一 个 普通 用 户 运 行 一 个 程 

序 ， 这 个 程序 由 根 用 户 (root) 所 有 ， 并 且 设 置 了 setuid 位 ， 这 个 程序 运行 时 具有 超级 用 户 的 特权 ， 这 样 程序 就 可 以 访 
问 普 通用 户 禁止 访问 的 文件 和 目录 。 很 明显 ， 因 为 这 会 引起 安全 方面 的 问题 ， 所 有 可 以 设置 setuid 位 的 程序 个 数 ， 必 
须 控 制 在 绝对 小 的 范围 内 。 























第 二 个 是 setgid 位 (八进制 2000) ， 这 个 相似 于 setuid 位 ， 把 有 效用 户 组 ID 从 真正 的 用 户 组 ID 更 改 为 文件 所 有 者 
的 组 ID。 如 果 设 置 了 一 个 目录 的 setgid 位 ， 则 目录 中 新 创建 的 文件 具有 这 个 目录 用 户 组 的 所 有 权 ， 而 不 是 文件 创建 者 
所 属 用 户 组 的 所 有 权 。 对 于 共享 目录 来 说 ， 当 一 个 普通 用 户 组 中 的 成 员 ， 需 要 访问 共享 目录 中 的 所 有 文件 ， 而 不 管 文 
件 所 有 者 的 主 用 户 组 时 ， 那么 设置 setgid 位 很 有 用 你。 














第 三 个 是 sticky 位 (八进制 .000) 。 这 个 继承 于 Unix， 在 Unix 中 ， 它 可 能 把 一 个 可 执行 文件 标志 为 “不 可 交换 的 ”。 
在 Linux 中 ， 会 忽略 文件 的 sticky 位 ， 但 是 如 果 一 个 目录 设置 了 sticky 位 ， 那么 它 能 阻止 用 户 删 除 或 重 命名 文件 ， 除 
非 用 户 是 这 个 目录 的 所 有 者 ， 或 者 是 文件 所 有 者 ， 或 是 超级 用 户 。 这 个 经 常用 来 控制 访问 共享 目录 ， 比 方 说 /tmp。 








这 里 有 一 些 例子 ， 使 用 chmod 命 合 和 符号 表示 法 ， 来 设置 这 些 特殊 的 权限 。 首 先 ， 授予 一 个 程序 setuid 权限 。 
chmod u+s program 

下 一 步 ， 授 予 一 个 目录 setgid 权限 : 

chmod g+s dir 

最 后 ， 授 予 一 个 目录 sticky 权限 : 


chmod +t dir 





加 
谎 


当 浏览 ls 命令 的 输出 结果 时 ， 你 可 以 确认 这 些 特 殊 权 限 。 这 里 有 一 些 例子 。 首 先 ， 一 个 程序 被 设置 为 setuid 属 
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具有 setgid 属性 的 目录 : 





drwxrwsr-x 


设置 了 sticky 位 的 目录 : 





drwxrwxrwt 


更 改 身 份 


在 不 同 的 时 候 ， 我 们 会 发 现 很 有 必要 具有 另 一 个 用 户 的 身份 。 经 常 地 ， 我 们 想 要 得 到 超级 用 户 特权 ， 来 执行 一 些 管 理 任 务 ， 
但 是 也 有 可 能 " 变 为 " 另 一 个 普通 用 户 ， 比 如 说 测试 一 个 帐号 。 有 三 种 方式 ， 可 以 拥有 多 重 身 份 : 


1. 注销 系统 并 以 其 他 用 户 身份 重新 登录 系统 。 

2. 使 用 su 命令 。 

3. 使 用 sudo 命令 。 
我 们 将 跳 过 第 一 种 方法 ， 因 为 我 们 知道 怎样 使 用 它 ， 并 且 它 缺乏 其 它 两 种 方法 的 方便 性 。 在 我 们 自己 的 shell 会 话 中 ，su 命 
使 允许 你 ， 假 定 为 另 一 个 用 户 的 身份 ， 以 这 个 用 户 的 ID 启动 一 个 新 的 shell 会 话 ， 或 者 是 以 这 个 用 户 的 身份 来 发 布 一 个 命 
仿 。sudo 命令 允许 一 个 管理 员 设置 一 个 叫做 /etc/sudoers 的 配置 文件 ， 并 且 定 义 了 一 些 具 体 命 售 ， 在 假定 的 身份 下 ， 特 殊 


用 户 可 以 执行 这 些 命 令 。 选 择 使 用 哪个 命 舍 ， 很 大 程度 上 是 由 你 使 用 的 Linux 发 行 版 来 决定 的 。 你 的 发 行 版 可 能 这 两 个 命 兮 
都 包含 ， 但 系统 配置 可 能 会 偏 祖 其 中 之 一 。 我 们 先 介 绍 su 命 邻 。 


su 一 以 其 他 用 户 身份 和 组 ID 运行 一 个 shell 
su 命令 用 来 以 另 一 个 用 户 的 身份 来 启动 shell。 这 个 命令 语法 看 起 来 像 这 样 : 


su [-[I]] [user] 


如 果 包 含 "-!" 选 项 ， 那 么 会 为 指定 用 户 和 启动 一 个 需要 登录 的 shell。 这 意味 着 会 加 载 此 用 户 的 shell 环境 ， 并 且 工 作 目 录 会 更 改 
到 这 个 用 户 的 主 目录 。 这 通常 是 我 们 所 需要 的 。 如 果 不 指定 用 户 ， 那 么 就 假定 是 超级 用 户 。 注 意 (不 可 思议 地 ) ， 选 项 "-|" 可 
以 缩写 为 "-"， 这 是 经 常用 到 的 形式 。 和 启动 超级 用 户 的 shell， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ su - 
Password : 
[root@linuxbox ~]# 


按 下 回 车 符 之 后 ，shell 提示 我 们 输入 超级 用 户 的 密码 。 如 果 密 码 输入 正确 ， 出 现 一 个 新 的 shell 提示 符 ， 这 表明 这 个 shell 
具有 超级 用 户 特权 (提示 符 的 末尾 字符 是 '#" 而 不 是 "$") ， 并 且 当 前 工作 目录 是 超级 用 户 的 主 目录 (通常 是 root) 。 一 旦 进 
入 一 个 新 的 shell， 我 们 能 执行 超级 用 户 所 使 用 的 命令。 当 工 作 完 成 后 ， 输入 "exit"， 则 返回 到 原来 的 shell: 


[root@linuxbox ~]# exit 
[me@linuxbox ~]$ 


以 这 样 的 方式 使 用 su 命令 ， 也 可 以 只 执行 单个 命 舍 ， 而 不 是 启动 一 个 新 的 可 交互 的 shell : 
su -ccommand ' 


使 用 这 种 模式 ， 命 令 传 递 到 一 个 新 shell 中 执行 。 把 命令 用 单 引 号 引起 来 很 重要 ， 因 为 我 们 不 想 命令 在 我 们 的 shell 中 展开 ， 
但 需要 在 新 shell 中 展开 。 


[me@linuxbox ~]$ su -c 'ls -| /root/*" 
Password: 
-TW------- 1rootroot 754 2007-08-11 03:19 /root/anaconda-ks.cfg 


/root/Mail: 
total 0 
[me@linuxbox ~]$ 


sudo 一 以 另 一 个 用 户 身份 执行 命令 


sudo 命令 在 很 多 方面 都 相似 于 su 命 舍 ， 但 是 sudo 还 有 一 些 非 常 重 要 的 功能 。 管 理 员 能 够 配置 sudo 命令 ， 从 而 允许 一 个 普 
通用 户 以 不 同 的 身份 (通常 是 超级 用 户 ) ， 通 过 一 种 非常 可 控 的 方式 来 执行 命 舍 。 尤 其 是 ， 只 有 一 个 用 户 可 以 执行 一 个 或 多 
个 特殊 命令 时 ， (更 体现 了 sudo 命令 的 方便 性 ) 。 另 一 个 重要 差异 是 sudo 命令 不 要 求 超级 用 户 的 密码 。 使 用 sudo 命 兮 
时 ， 用 户 使 用 他 /她 自己 的 密码 来 认证 。 比 如 说 ， 例 如 ，sudo 命令 经 过 配置 ， 人 允许 我 们 运行 一 个 虚构 的 各 份 程序 ， 叫 做 
"backup_script"， 这 个 程序 要 求 超级 用 户 权限 。 通 过 sudo 命 伟 ， 这 个 程序 会 像 这 样 运行 : 


[me@linuxbox ~]$ sudo backup_script 
Password: 
System Backup Starting... 


按 下 回 车 键 之 后 ，shell 提示 我 们 输入 我 们 的 密码 (不 是 超级 用 户 的 ) 。 一 县 认证 完成 ， 则 执行 具体 的 命令。su 和 sudo 之 
间 的 一 个 重要 区 别 是 sudo 不 会 重新 启动 一 个 shell， 也 不 会 加 载 另 一 个 用户 的 shell 运行 环境 。 这 意味 者 命令 不 必用 单 引 号 
引起 来 。 注 意 通 过 指定 各 种 各 样 的 选项 ， 这 种 行为 可 以 被 推翻 。 详 细 信息 ， 阅 读 sudo 手册 页 。 


想 知 道 sudo 命令 可 以 授予 哪些 权限 ， 使 用 "选项 ， 列 出 所 有 权限 : 


[me@linuxbox ~]$ sudo -| 
User me may run the following commands on this host: 
(ALL) ALL 


Ubuniu 与 sudo 


普通 用 户 经 常会 遇 到 这 样 的 问题 ， 怎 样 完成 某 些 需 要 超级 用 户 权 限 的 任务 。 这 些 任务 包括 安装 和 更 新 软件 ， 编 辑 系统 
配置 文件 ， 和 访问 设备 。 在 Windows 世界 里 ， 这 些 任务 是 通过 授予 用 户 管理 员 权 限 来 完成 的 。 这 人 允许 用 户 执行 这 些 
任务 。 然 而 ， 这 也 会 导致 用 户 所 执行 的 程序 拥有 同样 的 能 力 。 在 大 多 数 情况 下 ， 这 是 我 们 所 期 望 的 ， 但 是 它 也 人 允许 

malware (和 恶意 软件 ) ， 上 比方 说 电脑 病毒 ， 自 由 地 支配 计算 机 。 


























在 Unix 世界 中 ， 由 于 Unix 是 多 用 户 系统 ， 所 以 在 普通 用 户 和 管理 员 之 间 总 是 存在 很 大 的 差别 。Unix 采取 的 方法 是 只 
有 在 需要 的 时 候 ， 才 授予 普通 用 户 超级 用 户 权限 。 这 样 ， 普 静 会 用 到 su 和 sudo 命 倒 。 


























几 年 前 ， 大 多 数 的 Linux 发 行 版 都 依赖 于 su 命令 ， 来 达到 目的 。su 命令 不 需要 sudo 命令 所 要 求 的 配置 ，su 命令 拥 
有 一 个 root 帐号， 是 Unix 中 的 传统 。 但 这 会 引起 问题 。 所 有 用 户 会 企图 以 root 用 户 帐 号 来 操纵 系统 。 事 实 上 ， 一 些 
用 户 专门 以 root 用 户 帐 号 来 操作 系统 ， 因为 这 样 做 ， 的 确 消 除了 所 有 那些 讨厌 的 “权限 被 拒绝 "的 消息 。 相 比 于 
Windows 系统 安全 性 而 言 ， 这 样 做 ， 你 就 削弱 了 Linux 系统 安全 性 能 。 不 是 一 个 好 主意 。 








当 引 进 Ubuntu 的 时 候 ， 它 的 创作 者 们 采取 了 不 同 的 策略 。 黑 认 情 况 下 ，Ubuntu 不 允许 用 户 登 录 到 root 帐 号 (因为 
不 能 为 root 帐号 设置 密码 ) ， 而 是 使 用 sudo 命令 授予 普通 用 户 超级 用 户 权限 。 通过 sudo 命令 ， 最 初 的 用 户 可 以 拥 
有 超级 用 户 权限 ， 也 可 以 授予 随后 的 用 户 帐号 相似 的 权力 。 

















chown 一 更 改 文件 所 有 者 和 用 户 组 


chown 命令 被 用 来 更 改 文件 或 目录 的 所 有 者 和 用 户 组 。 使 用 这 个 命令 需要 超级 用 户 权限 。chown 命令 的 语法 看 起 来 像 这 
祥 : 


chown [owner][:[group]] file... 


chown 命令 可 以 更 改 文件 所 有 者 和 /或 文件 用 户 组 ， 依 据 于 这 个 命令 的 第 一 个 参数 。 这 里 有 一 些 例子 : 


表 10-6: chown 参数 实例 


参数 结果 
bob 把 文件 所 有 者 从 当前 属 主 更 改 为 用 户 bob。 
bob:users 把 文件 所 有 者 改 为 用 户 bob， 文 件 用 户 组 改 为 用 户 组 Users。 
:admins 把 文件 用 户 组 改 为 组 admins， 文 件 所 有 者 不 变 。 
bob: 文件 所 有 者 改 为 用 户 bob， 文 件 用 户 组 改 为 ， 用 户 bob 登录 系统 时 ， 所 属 的 用 户 组 。 





比方 说 ， 我 们 有 两 个 用 户 ，janet， 拥 有 超级 用 户 访问 权限 ， 而 tony 没有 。 用 户 jant 想 要 从 她 的 主 目录 复制 一 个 文件 到 用 户 
tony 的 主 目录 。 因 为 用 户 jant 想 要 tony 能 够 编辑 这 个 文件 ，janet 把 这 个 文件 的 所 有 者 更 改 为 tony: 


[janet@linuxbox ~]$ sudo cp myfile.txt ~tony 

Password: 

[janet@linuxbox ~]$ sudo ls -| ~tony/myfile.txt 

-rw-r--r-- 1 root root 8031 2008-03-20 14:30 /home/tony/myfile.txt 
[janet@linuxbox ~]$ sudo chown tony: ~tony/myfile.txt 
[janet@linuxbox ~]$ sudo ls -| ~tony/myfile.txt 

-rw-r--r-- 1 tony tony 8031 2008-03-20 14:30 /home/tony/myfile.txt 


这 里 ， 我 们 看 到 用 户 janet 把 文件 从 她 的 目录 复制 到 tony 的 主 目录 。 下 一 步 ，janet 把 文件 所 有 者 从 root (使 用 sudo 命 兮 
的 原因 ) 改 到 tony。 通 过 在 第 一 个 参数 中 使 用 末尾 的 "…" 字 符 ，janet 同时 把 文件 用 户 组 改 为 tony 登录 系统 时 ， 所 属 的 用 户 
组 ， 础 巧 是 用 户 组 tony。 





注意 ， 第 一 次 使 用 sudo 命令 之 后 ， 为 什么 (shell) 没有 提示 janet 输入 她 的 密码 ? 这 是 因为 ， 在 大 多 数 的 配置 中 ，sudo 命 
兮 会 相信 你 几 分 钟 ， 直 到 计时 结 


chgrp 一 更 改 用 户 组 所 有 权 





在 旧版 Unix 系统 中 ，chown 命令 只 能 更 改 文件 所 有 权 ， 而 不 是 用 户 组 所 有 权 。 为 了 达到 目的 ， 使 用 一 个 独立 的 命 
令 ，chgrp 来 完成 。 除 了 限制 多 一 点 之 外 ，chgrp 命令 与 chown 命令 使 用 起 来 很 相似 。 


练习 使 用 权限 


到 目前 为 止 ， 我 们 已 经 知道 了 ， 权 限 这 类 东西 是 怎样 工作 的 ， 现 在 是 时 候 炫 光一 下 了 。 我 们 将 展示 一 个 常见 问题 的 解决 方 

案 ， 这 人 人 个 共享 目录 。 假 想 我 们 有 两 个 用 户 ， 他 们 分 别 是 "bill" 和 "karen"。 他 们 都 有 音乐 CD 收藏 品 ， 也 
愿意 设置 一 个 共享 目录 ， 在 这 个 共享 目录 中 ， 他 们 分 别 以 0gg Vorbis 或 MP3 的 格式 来 存储 他 们 的 音乐 文件 。 通 过 sudo 命 
今 ， 用 户 bi 








我 们 需要 做 的 第 一 件 事 ， 是 创建 一 个 以 bill 和 karen 为 成 员 的 用 户 组 。 使 用 图 形 化 的 用 户 管理 工具 ， bill 创建 了 一 个 叫做 
music 的 用 户 组 ， 并 且 把 用 户 bill 和 karen 添加 到 用 户 组 music 中: 


Basic Settings 





Group name; | music | 








Group ID: |2001 





Group Members 





力 william Shotts [一 





Guest Account 要 

















root 






































图 3: 用 GNOME 创建 一 个 新 的 用 户 组 


下 一 步 ，bill 创建 了 存储 音乐 文件 的 目录 : 


[bill@linuxbox ~]$ sudo mkdir /usr/local/share/Music 
password: 


因为 bill 正在 他 的 主 目录 之 外 操作 文件 ， 所 以 需要 超级 用 户 权 限 。 这 个 目录 创建 之 后 ， 它 具有 以 下 所 有 权 和 权限 : 


[bill@linuxbox ~]$ ls -ld /usr/local/share/Music 
drwxr-xr-x 2 root root 4096 2008-03-21 18:05 /usr/local/share/Music 


正如 我 们 所 见 到 的 ， 这 个 目录 由 root 用 户 拥 有 ， 并 且 具 有 权限 755。 为 了 使 这 个 目录 共享 ， 人 允许 (用户 karen) 写 入 ，bill 需 
要 更 改 目录 用 户 组 所 有 权 和 权限 : 


[bill@linuxbox ~]$ sudo chown :music /usr/local/share/Music 
[bill@linuxbox ~]$ sudo chmod 775 /usr/local/share/Music 
[bill@linuxbox ~]$ ls -ld /usr/local/share/Music 

drwxrwxr-x 2 root music 4096 2008-03-21 18:05 /usr/local/share/Music 


那么 这 是 什么 意思 呢 ? 它 的 意思 是 ， 现 在 我 们 拥有 一 个 目录 ，/usr/local/share/Music， 这 个 目录 由 root 用 户 拥 有 ， 并 且 允许 
用 户 组 music 读 取 和 写 入 。 用 户 组 music 有 两 个 成 员 bill 和 karen， 这 样 bill 和 karen 能 够 在 目录 /usr/local/share/Music 中 
创建 文件 。 其 他 用 户 能 够 列 出 目录 中 的 内 容 ， 但 是 不 能 在 其 中 创建 文件 。 


但 是 我 们 仍然 会 遇 到 问题 。 通 过 我 们 目前 所 拥有 的 权限 ， 在 Music 目录 中 创建 的 文件 ， 只 具有 用 户 bill 和 karen 的 普通 权 
限 : 


[bill@linuxbox ~]$ > /usr/local/share/Music/test file 
[bill@linuxbox ~]$ ls -| /usr/local/share/Music 
-rwW-r--r-- 1 bill bill 0 2008-03-24 20:03 test file 


实际 上 ， 存 在 两 个 问题 。 第 一 个 ， 系 统 中 默认 的 掩 码 值 是 0022， 这 会 禁止 用 户 组 成 员 编 辑 属于 同 组 成 员 的 文件 。 如 果 共 享 目 
录 中 只 包含 文件 ， 这 就 不 是 个 问题 ， 但 是 因为 这 个 目录 将 会 存储 音乐 ， 通常 音乐 会 按照 艺术 家 和 唱片 的 层次 结构 来 组 织 分 
类 。 所 以 用 户 组 成 员 需 要 在 同 组 其 他 成 员 创建 的 目录 中 创建 文件 和 目录 。 我 们 将 把 用 户 bill 和 karen 使 用 的 掩 码 值 改 为 
0002。 


第 二 个 问题 是 ， 用 户 组 成 员 创建 的 文件 和 目录 的 用 户 组 ， 将 会 设置 为 用 户 的 主要 组 ， 而 不 是 用 户 组 music。 通过 设置 此 目录 
的 setgid 位 来 解决 这 个 问题 : 


[bill@linuxbox ~]$ sudo chmod g+s /usr/local/share/Music 
[bill@linuxbox ~]$ ls -ld /usr/local/share/Music 
drwxrwsr-x 2 root music 4096 2008-03-24 20:03 /usr/local/share/Music 


现在 测试 一 下 ， 看 看 是 否 新 的 权限 解决 了 这 个 问题 。bill 把 他 的 掩 码 值 设 为 0002， 删 除 先前 的 测试 文件 ， 并 创建 了 一 个 新 的 
测试 文件 和 目录 : 


[bi 


@linuxbox ~]$ umask 0002 


[bi 


@linuxbox ~]$ rm /usr/local/share/Music/test file 


[bill@linuxbox ~]$ > /usr/local/share/Music/test file 
[bill@linuxbox ~]$ mkdir /usr/local/share/Music/test _ dir 
[bill@linuxbox ~]$ ls -| /usr/local/share/Music 
drwxrwsr-x2 bill music 4096 2008-03-24 20:24 test dir 
-rw-rw-r-- 1 bill music 0 2008-03-24 20:22 test file 
[bill@linuxbox ~]$ 














现在 ， 创 建 的 文件 和 目录 都 具有 正确 的 权限 ， 人 允许 用 户 组 music 的 所 有 成 员 在 目录 Music 中 创建 文件 和 目录 。 


剩 下 一 个 问题 是 关于 umask 命令 的 。umask 命令 设置 的 掩 码 值 只 能 在 当前 shell 会 话 中 生效 ， 若 当前 shell 会 话 结束 后 ， 则 
必须 重新 设置 。 在 这 本 书 的 第 三 部 分 ， 我 们 将 看 一 下 ， 怎 样 使 掩 码 值 永 久生 效 。 


更 改 用 户 密码 


这 一 章 最 后 一 个 话题 ， 我 们 将 讨论 自己 帐号 的 密码 (和 其 他 人 的 密码 ， 如 果 你 具有 超级 用 户 权 限 ) 。 使 用 passwd 命令 ， 来 
设置 或 更 改 用 户 密码 。 命 令 语 法 如 下 所 示 : 


passwd [user] 
只 要 输入 passwd 命令 ， 就 能 更 改 你 的 密码 。shell 会 提示 你 输入 你 的 旧 密 码 和 你 的 新 密码 : 


[me@linuxbox ~]$ passwd 
(current) UNIX password: 
New UNIX password: 


passwd 命令 将 会 试 着 强迫 你 使 用 " 强 "密码 。 这 意味 着 ， 它 会 拒绝 接受 太 短 的 密码 ， 与 先前 相似 的 密码 ， 字典 中 的 单词 作为 密 
码 ， 或 者 是 太 容易 猜 到 的 密码 : 


[me@linuxbox ~]$ passwd 

(current) UNIX password: 

New UNIX password: 

BAD PASSWORD: is too similar to the old one 
New UNIX password: 

BAD PASSWORD: it is WAY too short 

New UNIX password: 

BAD PASSWORD: it is based on a dictionary word 


如 果 你 具有 超级 用 户 权 限 ， 你 可 以 指定 一 个 用 户 名 作为 passwd 命令 的 参数 ， 这 样 可 以 设置 另 一 个 用 户 的 密码 。 还 有 其 它 的 
passwd 命令 选项 对 超级 用 户 有 效 ， 人 允许 帐号 锁定 ， 密 码 失 效 ， 等 等 。 详细 内 容 ， 参 考 passwd 命令 的 手册 页 。 


拓展 阅读 


e Wikipedia 上 面 有 一 篇 关于 malware (恶意 软件 ) 好 文章 : 


http:W/en.wikipedia.orgiki/Malware 
还 有 一 系列 的 命令 行程 序 ， 可 以 用 来 创建 和 维护 用 户 和 用 户 组 。 更 多 信息 ， 查 看 以 下 命令 的 手册 页 : 
e adduser 
e USeradd 


e groupadd 


、 口 

进程 

通常 ， 现 在 的 操作 系统 都 支持 多 任务 ， 意 味 着 操作 系统 (给 用 户 ) 造成 了 一 种 假象 ，( 让 用 户 觉得 ) 它 同时 能 够 做 多 件 事情 ， 
事实 上 ， 它 是 快速 地 轮换 执行 这 些 任务 的 。Linux 内 核 通 过 使 用 进程 ， 来 管理 多 任务 。 通 过 进程 ，Linux 安排 不 同 的 程序 等 
待 使 用 CPU。 


有 时 候 ， 计 算 机 变 得 呆滞， 运行 缓慢 ， 或 者 一 个 应 用 程序 停止 响应 。 在 这 一 章 中 ， 我 们 将 看 一 些 可 用 的 命令 行 工具 ， 这 些 工 
具 帮 助 我 们 查看 程序 的 执行 状态 ， 以 及 怎样 终止 行为 不 当 的 进程 。 


这 一 章 将 介绍 以 下 命令 : 
e ps 一 报告 当前 进程 快照 
e top 一 显示 任务 
e jobs 一 列 出 活路 的 任务 
e。 bg -把 一 个 任务 放 到 后 台 执 行 
e。 fg 一 把 一 个 任务 放 到 前 台 执行 
e kill 一 给 一 个 进程 发 送信 号 
e killall - 杀 死 指定 名 字 的 进程 


e shutdown - 关机 或 重启 系统 


进程 是 怎样 工作 的 


当 系 统 启 动 的 时 候 ， 内 核 先 把 一 些 它 自己 的 程序 初始 化 为 进程 ， 然 后 运行 一 个 叫做 init 的 程序 。init， 依次 地 ， 再 运行 一 系列 
的 称 为 init 脚本 的 shell 脚本 〈 位 于 /etc) ， 它 们 可 以 启动 所 有 的 系统 服务 。 其 中 许多 系统 服务 以 守护 (daemon) 程序 的 形 
式 实现 ， 守 护 程序 仅 在 后 台 运 行 ， 没 有 任何 用 户 接口 。 这 样 ， 即 使 我 们 没有 登录 系统 ， 至 少 系统 也 在 忙于 执行 一 些 例 行 

务 。 


一 个 程序 可 以 发 动 另 一 个 程序 ， 这 个 事实 在 进程 方案 中 ， 表 述 为 一 个 父 进程 创建 了 一 个 子 进程 。 


内 核 维护 每 个 进程 的 信息 ， 以 此 来 保持 事情 有 序 。 例 如 ， 系 统 分 配给 每 个 进程 一 个 数字 ， 这 个 数字 叫做 进程 ID 或 PID。PID 
号 按 升序 分 配 ，init 进程 的 PID 总 是 1。 内 核 也 对 分 配给 每 个 进程 的 内 存 进 行 跟踪 。 像 文件 一 样 ， 进 程 也 有 所 有 者 和 用 户 
ID， 有 效用 户 ID， 等 等 。 


查看 进程 


查看 进程 ， 最 常 使 用 地 命令 〈 有 几 个 命令 ) 是 ps。ps 程序 有 许多 选项 ， 它 最 简单 地 使 用 形式 是 这 样 的 : 


[me@linuxbox ~]$ ps 

PID TTY TIME CMD 
5198 pts/1 00:00:00 bash 
10129 pts/1 00:00:00 ps 


上 例 中 ， 列 出 了 两 个 进程 ， 进 程 5198 和 进程 10129， 各 自 代表 命令 bash 和 ps。 正 如 我 们 所 看 到 的 ， 默认 情况 下 ，ps 不 
会 显示 很 多 进程 信息 ， 只 是 列 出 与 当前 终端 会 话 相 关 的 进程 。 为 了 得 到 更 多 信息 ， 我 们 需要 加 上 一 些 选项 ， 但 是 在 这 样 做 之 
前 ， 我 们 先 看 一 下 ps 命令 运行 结果 的 其 它 字段 。 TTY 是 "Teletype" 的 简写 ， 是 指 进程 的 控制 终端 。 这 里 ，Unix 展示 它 的 年 
龄 。TIME 字段 表示 进程 所 消耗 的 CPU 时 间 数 量 。 正 如 我 们 所 看 到 的 ， 这 两 个 进程 使 计算 机 工作 起 来 很 轻松 。 


如 果 给 ps 命令 加 上 选项 ， 我 们 可 以 得 到 更 多 关于 系统 运行 状态 的 信息 : 


[me@linuxbox ~]$ ps x 

PID TTY STAT TIME COMMAND 

2799? Ssl 0:00 /usr/libexec/bonobo-activation-server -ac 
2820? SI 0:01 /usr/libexec/evolution-data-server-1.10 -- 


and many more... 


加 上 "x" 选项 (注意 没有 开头 的 "-" 字符 ) ， 告 诉 ps 命令 ， 展 示 所 有 进程 ， 不 管 它 们 由 什么 终端 (如果 有 的 话 ) 控制 。 在 
TTY 一 栏 中 出 现 的 "?" ， 表 示 没 有 控制 终端 。 使 用 这 个 "x" 选项 ， 可 以 看 到 我 们 所 拥有 的 每 个 进程 的 信息 。 


因为 系统 中 正 运 行 着 许多 进程 ， 所 以 ps 命令 的 输出 结果 很 长 。 这 经 常 很 有 帮助 ， 要 是 把 ps 的 输出 结果 管道 到 less 命 今 ， 
借助 less 工具 ， 更 容易 浏览 。 一 些 选项 组 合 也 会 产生 很 长 的 输出 结果 ， 所 以 最 大 化 终端 仿真 器 窗口 ， 也 是 一 个 好 主意 。 





输出 结果 中 ， 新 添加 了 一 栏 ， 标 题 为 STAT 。STAT 是 "state" 的 简写 ， 它 揭示 了 进程 当前 状态 : 


表 11-1: 进程 状态 


状态 意义 
R 运行 。 这 意味 着 ， 进 程 正在 运行 或 准备 运行 。 
S 正在 睡眠 。 进程 没有 运行 ， 而 是 ， 正 在 等 待 一 个 事件 ， 比如 说 ， 一 个 按键 或 者 网 络 数据 包 。 
D 不 可 中 断 睡 眠 。 进 程 正在 等 待 VD， 比方 说 ， 一 个 磁盘 驱动 器 的 I/O。 
T 已 停止 . 已 经 指示 进程 停止 运行 。 稍 后 介绍 更 多 。 
> 一 个 死 进程 或 "僵尸 "进程 。 这 是 一 个 已 经 终止 的 子 进程 ， 但 是 它 的 父 进程 还 没有 清空 它 。 〈 父 进程 没 


有 把 子 进程 从 进程 表 中 删除 ) 

一 个 高 优先 级 进程 。 这 可 能 会 授予 一 个 进程 更 多 重要 的 资源 ， 给 它 更 多 的 CPU 时 间 。 进程 的 这 种 属 
< 性 叫做 niceness。 具 有 高 优先 级 的 进程 据说 是 不 好 的 〈less nice) ， 因为 它 占 用 了 比较 多 的 CPU 
时 间 ， 这 样 就 给 其 它 进程 留 下 很 少时 间 。 

低 优先 级 进程 。 一 个 低 优先 级 进程 (一 个 “好 ”进程 ) 只 有 当 其 它 高 优先 级 进程 执行 之 后 ， 才 会 得 到 处 
理 器 时 间 。 

进程 状态 信息 之 后 ， 可 能 还 跟随 其 他 的 字符 。 这 表示 各 种 外 来 进程 的 特性 。 详 细 信 息 请 看 ps 手册 页 。 


另 一 个 流行 的 选项 组 合 是 "aux'" (不 带 开头 的 "-" 字 符 ) 。 这 会 给 我 们 更 多 信息 : 


[me@linuxbox ~]$ ps aux 

USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND 
root 二 0 二 全 OZ 本 二 4 > Mar05 0:31 init 

root 2 0 O° S&lt; Mar05 0:00 [kt] 


and many more... 





这 个 选项 组 合 ， 能 够 显示 属于 每 个 用 户 的 进程 信息 。 使 用 这 个 选项 ， 可 以 唤醒 “BSD 风格 ” 的 输出 结果 。 Linux 版 本 的 ps 命 
仿 ， 可 以 模拟 几 个 不 同 Unix 版 本 中 的 ps 程序 的 行为 。 通 过 这 些 选项 ， 我 们 得 到 这 些 额 外 的 列 。 














表 11-2: BSD 风格 的 ps 命 邻 列 标题 


USER 用 户 ID. 进程 的 所 有 者 。 

%CPU 以 百分比 表示 的 CPU 使 用 率 

%MEM 以 百分比 表示 的 内 存 使 用 率 

VSZ 虚拟 内 存 大 小 

RSS 进程 占用 的 物理 内 存 的 大 小 ， 以 千 字 节 为 单位 。 
START 进程 运行 的 起 始 时 间 。 若 超过 24 小 时 ， 则 用 天 表示 。 


虽然 ps 命令 能 够 展示 许多 计算 机 运行 状态 的 信息 ， 但 是 它 只 是 提供 ，ps 命令 执行 时 刻 的 机 器 状态 快照 。 为 了 看 到 更 多 动态 
的 信息 ， 我 们 使 用 top 命令 : 


[me@linuxbox ~]$ top 


top 程序 连续 显示 系统 进程 更 新 的 信息 (默认 情况 下 ， 每 三 分 钟 更 新 一 次 ) ，"top" 这 个 名 字 来 源 于 这 个 事实 ，top 程序 是 用 
来 查看 系统 中 “顶端 "进程 的 。top 显示 结果 由 两 部 分 组 成 : 最 上 面 是 系统 概要 ， 下 面 是 进程 列表 ， 以 CPU 的 使 用 率 排序 。 


top - 14:59:20 up 6:30, 2 users, load average: 0.07, 0.02, 0.00 
Tasks: 109 total, 1 running, 106 sleeping, 0 stopped, 2 zombie 
Cpu(s): 0.7%us, 1.0%sy, 0.0%ni, 98.3%id, 0.0%wa, 0.0%hi, 0.0%si 
Mem: 319496k total, 314860k used, 4636k free, 19392k buff 
Swap: 875500k total, 149128k used, 726372kfree, 114676k cach 


PIDAUSER: PR NI VIRT RES SHR S%CPU %MEM TIME+ COMMAND 
6244 me 39 19 31752 3124 2188 S 6.3 1.0 16:24.42 trackerd 


其 中 系统 概要 包含 许多 有 用 信息 。 下 表 是 对 系统 概要 的 说 明 : 


表 11-3: top 命令 信息 字段 





行 号 字段 意义 
1 top 程序 名 。 
14:59:20 当前 时 间 。 
up 6:30 ee ne doe et i a A 
经 运行 了 六 个 半 小 时 。 
2 users 有 两 个 用 户 登 录 系统 。 
加 载 平均 值 是 指 ， 等 待 运行 的 进程 数目 ， 也 就 是 说 ， 义 于 运行 状态 的 进程 个 数 ， 这 些 进 
load 程 共享 CPU。 展 示 了 三 个 数值 ， 每 个 数值 对 应 不 同 的 时 间 周期 。 第 一 个 是 最 后 60 秒 的 平 
average: 均值 ， 下 一 个 是 前 5 分 钟 的 平均 值 ， 最 后 一 个 是 前 15 分 钟 的 平均 值 。 若 平均 值 低 于 1.0， 
则 指示 计算 机 工作 不 忙碌 。 
2 Tasks: 总 结 了 进程 数目 和 各 种 进程 状态 。 
3 Cpu(s): 这 一 行 描述 了 CPU 正在 执行 的 进程 的 特性 。 
0.7%us 0.7% ofthe CPU is being used for user processes. 这 意味 着 进程 在 内 核 之 外 。 
1.0%sy 1.0% 的 CPU 时 间 被 用 于 系统 (内 核 ) 进程 。 
0.0%ni 0.0% 的 CPU 时 间 被 用 于 "nice”( 低 优先 级 ) 进程 。 
98.3%id 98.3% 的 CPU 时 间 是 空闲 的 。 
0.0%wa 0.0% 的 CPU 时 间 来 等 待 1O。 
4 Mem: 展示 物理 内 存 的 使 用 情况 。 
5 Swap: 展示 交换 分 区 (虚拟 内 存 ) 的 使 用 情况 。 


top 程序 接受 一 系列 从 键盘 输入 的 命令 。 两 个 最 有 趣 的 命令 是 h 和 q。h， 显 示 程序 的 帮助 屏幕 ，q， 退出 top 程序 。 


两 个 主要 的 桌面 环境 都 提供 了 图 形 化 应 用 程序 ， 来 显示 与 top 程序 相似 的 信息 (和 Windows 中 的 任务 管理 器 差别 不 多 ) ， 
但 是 我 觉得 top 程序 要 好 于 图 形 化 的 版 本 ， 因为 它 运行 速度 快 ， 并 且 消 费 很 少 的 系统 资源 。 毕 竟 ， 我 们 的 系统 监测 程序 不 能 
成 为 系统 仿 工 的 源泉 ， 而 这 是 我 们 试图 追踪 的 信息 。 





控制 进程 


现在 我 们 可 以 看 到 和 监测 进程 ， 然 后 得 到 一 些 对 它们 的 控制 权 。 为 了 我 们 的 实验 ， 我 们 将 使 用 一 个 叫做 xlogo 的 小 程序 ， 作 
为 我 们 的 实验 品 。 这 个 xlogo 程序 是 X 窗口 系统 (底层 引擎 使 图 形 界面 显示 在 屏幕 上 ) 提供 的 实例 程序 ， 这 个 实例 简单 地 显 
示 一 个 大 小 可 调 的 包含 X 标志 的 窗口 。 首 先 ， 我 们 需要 知道 测试 的 主题 : 


[me@linuxbox ~]$ xlogo 


如 
| 
汶 
] 蛋 
了 
i 

让 


命令 执行 之 后 ， 一 个 包含 X 标志 的 小 窗口 应 该 出 现在 屏幕 的 某 个 位 置 上 。 在 一 些 系统 中 ，xlogo 命 兮 
E31 全 
自 三 


小 贴 士 : 如 果 你 的 系统 不 包含 xlogo 程序 ， 试 着 用 gedit 或 者 kwrite 来 代替 。 


通过 调整 它 的 窗口 大 小 ， 我 们 能 够 证 明 xlogo 程序 正在 运行 。 如 果 这 个 标志 以 新 的 尺寸 被 重 画 ， 则 这 个 程序 正在 运行 。 





注意 ， 为 什么 我 们 的 shell 提示 符 还 没有 返回 ? 这 是 因为 shell 正在 等 待 这 个 程序 结束 ， 就 像 到 目前 为 止 我 们 用 过 的 其 它 所 有 
程序 一 样 。 如 果 我 们 关闭 xlogo 窗口 ，shell 提示 符 就 返回 了 。 


中 断 一 个 进程 


我 们 再 运行 xlogo 程序 一 次 ， 观 察 一 下 发 生 了 什么 事 。 首 先 ， 执 行 xlogo 命令 ， 并 且 证 实 这 个 程序 正在 运行 。 下 一 步 ， 回 到 
终端 窗口 ， 按 下 Ctrl-c。 





[me@linuxbox ~]$ xlogo 
[me@linuxbox ~]$ 


在 一 个 终端 中 ， 输 入 Ctrl-c， 中 断 一 个 程序 。 这 意味 着 ， 我 们 礼 谣 地 要 求 终止 这 个 程序 。 输入 Ctrl-c 之 后 ，xlogo 窗口 关 
闭 ，shell 提示 符 返 回 。 


通过 这 个 技巧 ， 许 多 (但 不 是 全 部 ) 命令 行程 序 可 以 被 中 断 。 


把 一 个 进程 放置 到 后 台 (执行 ) 


比方 说 ， 我 们 想 让 shell 提示 符 返 回 ， 却 没有 终止 xlogo 程序 。 为 达到 这 个 目的 ， 我 们 把 这 个 程序 放 到 后 台 执 行 。 把 终端 看 
作 是 一 个 有 前 台 (表层 放置 可 见 的 事物 ， 像 shell 提示 符 ) 和 后 台 (表层 之 下 放置 隐藏 的 事物 ) (的 设备 ) 。 启动 一 个 程 
序 ， 让 它 立 即 在 后 台 运行 ， 我 们 在 程序 命 命 之后， 加 上 "&" 字 符 : 


[me@linuxbox ~]$ xlogo & 
[1] 28236 
[me@linuxbox ~]$ 


执行 命令 之 后 ， 这 个 xlogo 窗口 出 现 ， 并 且 shell 提示 符 返 回 ， 同 时 打印 一 些 有 趣 的 数字 。 这 条 信息 是 shell 特性 的 一 部 分 ， 
叫做 工作 控制 。 通 过 这 条 信息 ，shell 告诉 我 们 ， 已 经 启动 了 工作 号 为 1(“ [1] "”) ，PID 为 28236 的 程序 。 如 果 我 们 运行 
ps 命令 ， 可 以 看 到 我 们 的 进程 : 


[me@linuxbox ~]$ ps 

PID TTY TIME CMD 
10603 pts/1 00:00:00 bash 
28236 pts/1 00:00:00 xlogo 
28239 pts/1 00:00:00 ps 


工作 控制 ， 这 个 shell 功能 可 以 列 出 从 终端 中 启动 的 任务 。 执 行 jobs 命令 ， 我 们 可 以 看 到 这 个 输出 列表 : 


[me@linuxbox ~]$ jobs 
[1]+ Running xlogo & 


结果 显示 我 们 有 一 个 任务 ， 编 号 为 “1"， 它 正在 运行 ， 并 且 这 个 任务 的 命令 是 xlogo &。 


进程 返回 到 前 台 


一 个 在 后 台 运 行 的 进程 对 一 切 来 自 键盘 的 输入 都 免疫 ， 也 不 能 用 Ctrl-c 来 中 断 它 。 使 用 fg 命令 ， 让 一 个 进程 返回 前 台 执行 : 


[me@linuxbox ~]$ jobs 


[1]+ Running xlogo & 
[me@linuxbox ~]$ fg %1 
xlogo 


fg 命令 之 后 ， 跟 随 着 一 个 百 分 号 和 工作 序号 〈 叫 做 jobspec) 。 如 果 我 们 只 有 一 个 后 台 任 务 ， 那 么 jobspec 是 可 有 可 无 的 。 
输入 Ctrl-c 来 终止 xlogo 程序 。 


停止 一 个 进程 


有 有 时候， 我们 想 要 停止 一 个 进程 ， 而 没有 终止 它 。 这 样 会 把 一 个 前 台 进 程 移 到 后 台 等 待 。 输入 Ctrl-z， 可 以 停止 一 个 前 台 进 
程 。 让 我 们 试 一 下 。 在 命令 提示 符 下 ， 执 行 xlogo 命令 ， 然后 输入 Ctrl-z: 


[me@linuxbox ~]$ xlogo 
[1]+ Stopped xlogo 
[me@linuxbox ~]$ 


停止 xlogo 程序 之 后 ， 通 过 调整 xlogo 的 窗口 大 小 ， 我 们 可 以 证 实 这 个 程序 已 经 停止 了 。 它 看 起 来 像 死 掉 了 一 样 。 使 用 fg 命 
令 ， 可 以 恢复 程序 到 前 台 运 行 ， 或 者 用 bg 命令 把 程序 移 到 后 台 。 


[me@linuxbox ~]$ bg %1 
[1]+ xlogo & 
[me@linuxbox ~]$ 


和 fg 命令 一 样 ， 如 果 只 有 一 个 任务 的 话 ，jobspec 参数 是 可 选 的 。 


因为 把 一 个 进程 从 前 台 移 到 后 台 很 方便 ， 如 果 我 们 从 命令 行 启动 一 个 图 形 界 面 的 程序 ， 但 是 忘记 把 它 放 到 后 台 执 行 ， 即 没有 
在 命令 后 加 上 字符 "&'"， (也 不 用 担心 ) 。 


为 什么 要 从 命令 行 启动 一 个 图 形 界面 程序 呢 ? 有 两 个 原因 。 第 一 个 ， 你 想 要 和 启 动 的 程序 ， 可 能 没有 在 窗口 管理 器 的 菜单 中 列 

出 来 (比方 说 xlogo) 。 第 二 个 ， 从 命令 行 启动 一 个 程序 ， 你 能 够 看 到 一 些 错误 信息 ， 如 果 从 窗口 系统 中 运行 程序 的 话 ， 这 

些 信息 是 不 可 见 的 。 有 时 候 ， 一 个 程序 不 能 从 图 形 界 面 菜单 中 启动 。 这 时 候 ， 应 该 从 命令 行 中 启动 它 。 我 们 可 能 会 看 到 错误 
息 ， 这 些 信息 揭示 了 问题 所 在 。 一 些 图 形 界面 程序 还 有 许多 有 意思 并 且 有 用 的 命令 行 选项 。 


语 / 必 ， 








kill 命 合 被 用 来 “ 杀 死 "程序 。 这 样 我 们 就 可 以 终止 需要 杀 死 的 程序 。 这 里 有 一 个 实例 : 


me@linuxbox ~]$ xlogo & 


[ 

[1] 28401 

[me@linuxbox ~]$ kill 28401 
[1]+ Terminated xlogo 


首先 ， 我 们 在 后 台 和 启动 xlogo 程序 。shell 打印 出 jobspec 和 这 个 后 台 进 程 的 PID。 下 一 步 ， 我 们 使 用 kill 命令 ， 并 且 指 定 我 
们 想 要 终止 的 进程 PID。 也 可 以 用 jobspec (例如 ,，“%1”) 来 代替 PID。 


虽然 这 个 命令 很 直接 了 当 ， 但 不 仅仅 这 些 。 这 个 kill 命令 不 是 确切 地 *“ 杀 死 "程序 ， 而 是 给 程序 发 送信 号 。 信 号 是 操作 系统 与 
程序 之 间 进 行 通信 ， 所 采用 的 几 种 方式 中 的 一 种 。 我 们 已 经 看 到 信号 ， 在 使 用 Ctrl-c 和 Ctrl-z 的 过 程 中 。 当 终端 接受 了 其 中 
一 个 按键 组 合 后 ， 它 会 给 在 前 端 运行 的 程序 发 送 一 个 信号 。 在 使 用 Ctrl-c 的 情况 下 ， 会 发 送 一 个 叫做 INT (中 断 ) 的 信号 ; 
当 使 用 Ctrl-z 时 ， 则 发 送 一 个 叫做 TSTP (终端 停止 ) 的 信和 号。 程序， 反 过 来 ， 倾 听信 号 的 到 来 ， 当 程序 接 到 信号 之 后 ， 则 
做 出 响应 。 一 个 程序 能 够 倾听 和 响应 信号 ， 这 个 事实 允许 一 个 程序 做 些 事情 ， 比如 ， 当 程序 接 到 一 个 终止 信号 时 ， 它 可 以 保 
存 所 做 的 工作 。 





kill 命令 被 用 来 给 程序 发 送信 号 。 它 最 常见 的 语法 形式 看 起 来 像 这 样 : 


kill [-signal] PID... 


如 果 在 命令 行 中 没有 指定 信号 ， 那 么 默认 情况 下 ， 发 送 TERM (终止 ) 信号 。kill 命令 被 经 常 用 来 发 送 以 下 命令 : 


表 11-4: 常用 信号 
编号 名 字 含义 
挂 起 。 这 是 美好 往昔 的 痕迹 ， 那 时 候 终 端 机 通过 电话 线 和 调制 解 调 器 连接 到 远 端的 计算 机 。 这 


个 信号 被 用 来 告诉 程序 ， 控 制 的 终端 机 已 经 “ 挂 起 "。 通过 关闭 一 个 终端 会 话 ， 可 以 说 明 这 个 信 
号 的 作用 。 发 送 这 个 信号 到 终端 机 上 的 前 台 程序 ， 程 序 会 终止 。 


1 HUP 许多 守护 进程 也 使 用 这 个 信号 ， 来 重新 初始 化 。 这 意味 着 ， 当 发 送 这 个 信号 到 一 个 守护 进程 
民生 人 al 
个 例子 。 

2 INT 中 断 。 实 现 和 Ctrl-c 一 样 的 功能 ， 由 终端 发 送 。 通 常 ， 它 会 终止 一 个 程序 。 


杀 死 。 这 个 信号 很 特别 。 鉴 于 进程 可 能 会 选择 不 同 的 方式 ， 来 处 理发 送 给 它 的 信号 ， 其 中 也 包 
全 忽 店 信号 ， 这 样 呢 ， 从 不 发 送 Kill 信号 到 目标 进程 。 而 是 内 核 立即 终止 这 个 进程 。 当 一 


Sa 程 以 这 种 方式 终止 的 时 候 ， 它 没有 机 会 去 做 些 清 理 " 工 作 ， 或 者 是 保存 劳动 成 果 。 因为 这 个 
因 ， 把 KILL 信号 看 作 杀 手 铜 ， 当 其 它 终 止 信号 失败 后 ， 再 使 用 它 。 

15 TERM 终止 。 这 是 kill 命令 发 送 的 默认 信号 。 如 果 程 序 仍 然 “ 活 着 "”， 可 以 接受 信号 ， 那 么 这 个 信号 终 
止 。 

18 CONT 继续 。 在 停止 一 段 时 间 后 ， 进 程 恢复 运行 。 

19 sTop 停止 。 这 个 信号 导致 进程 停止 运行 ， 而 没有 终止 。 像 KILL 信号 ， 它 不 被 发 送 到 目标 进程 ， 因 


此 它 不 能 被 忽略 。 


让 我 们 实验 一 下 kill 命令 


[me@linuxbox ~]$ xlogo & 


[1] 13546 
[me@linuxbox ~]$ kill -1 13546 
[1]+ Hangup xlogo 


在 这 个 例子 里 ， 我 们 在 后 台 启 动 xlogo 程序 ， 然 后 通过 kill 命令 ， 发 送 给 它 一 个 HUP 信号 。 这 个 xlogo 程序 终止 运行 ， 并 
且 shell 指示 这 个 后 台 进 程 已 经 接受 了 一 个 挂 起 信号 。 在 看 到 这 条 信息 之 前 ， 你 可 能 需要 多 按 几 次 enter 键 。 注 意 ， 既 可 以 
用 号 码 ， 也 可 以 用 名 字 ， 不 过 要 在 名 字 前 面 加 上 字母 “SIG"， 来 指定 所 要 发 送 的 信号 。 





[me@linuxbox ~]$ xlogo & 


[1] 13546 
[me@linuxbox ~]$ kill -1 13546 
[1]+ Hangup xlogo 


重复 上 面 的 例子 ， 试 着 使 用 其 它 的 信号 。 记 住 ， 你 也 可 以 用 jobspecs 来 代替 PID。 
进程 ， 和 文件 一 样 ， 拥 有 所 有 者 ， 所 以 为 了 能 够 通过 kill 命令 来 给 进程 发 送信 号 ， 你 必须 是 进程 的 所 有 者 (或 者 是 超级 用 
es 
除了 上 表 列 出 的 kill 命 合 最 常 使 用 的 信号 之 外 ， 还 有 一 些 系统 频繁 使 用 的 信号 。 以 下 是 其 它 一 些 常用 信号 列表 : 
表 11-5: 其 它 常用 信号 
编号 名 字 含义 
3 QUIT 退出 


I aE 段 错误 。 如 果 一 个 程序 非法 使 用 内 存 ， 就 会 发 送 这 个 信号 。 也 就 是 说 ， 程序 试图 写 和 人 内存 ， 
而 这 个 内 存 空间 是 不 允许 此 程序 写 入 的 。 

终端 停止 。 当 按 下 Ctrl-z 组 合 键 后 ， 终 端 发送 这 个 信号 。 不 像 STOP 信号 ，TSTP 信号 由 目标 

20 TSTP 进程 接收 ， 且 可 能 被 忽略 。 
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WINCH 改变 窗口 大 小 。 当 改变 窗口 大 小 时 ， 系 统 会 发 送 这 个 信号 。 一 些 程序 ， 像 top 和 less 程序 会 
响应 这 个 信和 号， 按照 新 窗口 的 尺寸 ， 刷 新 显示 的 内 容 。 


为 了 满足 读者 的 好 奇 心 ， 通 过 下 面 的 命令 可 以 得 到 一 个 完整 的 信号 列表 : 


[me@linuxbox ~]$ kill -| 


通过 killall 命令 给 多 个 进程 发 送信 号 


也 有 可 能 通过 killall 命令 ， 给 匹配 特定 程序 或 用 户 名 的 多 个 进程 发 送信 号 。 下 面 是 killall 命令 的 语法 形式 : 


killall [-u user] [-signal] name... 


为 了 说 明 情况 ， 我 们 将 启动 一 对 xlogo 程序 的 实例 ， 然 后 再 终止 它们 : 


[me@linuxbox ~]$ xlogo & 


[1] 18801 

[me@linuxbox ~]$ xlogo & 

[2] 18802 

[me@linuxbox ~]$ killall xlogo 

[1]- Terminated xlogo 

[2]+ Terminated xlogo 


记 住 ， 和 kill 命令 一 样 ， 你 必须 拥有 超级 用 户 权限 才能 给 不 属于 你 的 进程 发 送信 号 。 


更 多 和 进程 相关 的 命 仿 


因为 监测 进程 


命令 名 


pstree 


vmstat 


xload 


tload 


是 一 个 很 重要 的 系统 管理 任务 ， 所 以 有 许多 命令 与 它 相关 。 玩 玩 下 面 几 个 命令 : 





表 11-6: 其 它 与 进程 相关 的 命 全 
命令 描述 
输出 一 个 树 型 结构 的 进程 列表 ， 这 个 列表 展示 了 进程 间 父 / 子 关 系 。 


输出 一 个 系统 资源 使 用 快照 ， 包 括 内 存 ， 交 换 分 区 和 磁盘 /IO。 为 了 看 到 连续 的 显示 结果 ， 则 在 命 兮 
名 后 加 上 延 时 的 时 间 (以 秒 为 单位 ) 。 例 如 ，“vmstat 5"。 终止 输出 ， 按 下 Ctrl-c 组 合 键 。 


一 个 图 形 界面 程序 ， 可 以 画 出 系统 负载 的 图 形 。 
与 xload 程序 相似 ， 但 是 在 终端 中 画 出 图 形 。 使 用 Ctrl-c， 来 终止 输出 。 


shell 环境 





正如 我 们 之 前 所 讨论 到 的 ，shell 在 shell 会 话 中 维护 着 大 量 的 信息 ， 这 些 信 息 称 为 (shell) 环境 。 存储 在 shell 环境 中 的 数据 
被 程序 用 来 确定 配置 属性 。 然 而 大 多 数 程序 用 配置 文件 来 存储 程序 设置 ， 某 些 程序 也 会 查找 存储 在 shell 环境 中 的 数值 来 调 
整 他 们 的 行为 。 知 道 了 这 些 ， 我 们 就 可 以 用 shell 环境 来 自 定 制 shell 经 历 。 





在 这 一 章 ， 我 们 将 用 到 以 下 命令 : 

e。 printenv - 打印 部 分 或 所 有 的 环境 变量 

e Set 一 设置 shell 选项 

e export 一 导出 环境 变量 ， 让 随后 执行 的 程序 知道 。 

e alias - 创建 命令 别名 

什么 存储 在 环境 变量 中 ? 

shell 在 环境 中 存储 了 两 种 基本 类 型 的 数据 ， 虽 然 对 于 bash 来 说 ， 很 大 程度 上 这 些 类 型 是 不 可 辨别 的 。 它 们 是 环境 变量 和 
shell 变量 。Shell 变量 是 由 bash 存放 的 一 很 少数 据 ， 而 环境 变量 基本 上 就 是 其 它 的 所 有 数据 。 除 了 变量 ，shell 也 存储 了 一 


些 可 编程 的 数据 ， 命 名 为 别名 和 shell 函数 。 我 们 已 经 在 第 六 章 讨 论 了 别名 ， 而 shell 函数 (涉及 到 shell 脚本 ) 将 会 在 第 五 
部 分 叙述 。 


检查 环境 变量 


我 们 既 可 以 用 bash 的 内 部 命令 set， 或 者 是 printenv 程序 来 查看 什么 存储 在 环境 当中 。set 命令 可 以 显示 shell 和 环境 变量 
两 者 ， 而 printenv 只 是 显示 环境 变量 。 因 为 环境 变量 内 容 列 表 相 当 长 ， 所 以 最 好 把 每 个 命令 的 输出 结果 管道 到 less 命令 : 


[me@linuxbox ~]$ printenv | less 


执行 以 上 命令 之 后 ， 我 们 应 该 能 得 到 类 似 以 下 内 容 : 


我 们 所 看 到 的 是 环境 变量 及 其 数值 的 列表 。 例 如 ， 我 们 看 到 一 个 叫做 USER 的 变量 ， 这 个 变量 值 是 “me"”。printenv 命令 也 能 
够 列 出 特定 变量 的 数值 : 


[me@linuxbox ~]$ printenv USER 
me 


当 使 用 没有 带 选 项 和 参数 的 set 命令 时 ，shell 和 环境 变量 二 者 都 会 显示 ， 同 时 也 会 显示 定义 的 shell 函数 。 不 同 于 printenv 
命令 ，set 命 命 的 输出 结果 很 礼貌 地 按照 字母 顺序 排列 : 


[me@linuxbox ~]$ set | less 
也 可 以 通过 echo 命令 来 查看 一 个 变量 的 内 容 ， 像 这 样 : 


[me@linuxbox ~]$ echo $HOME 
/home/me 


如 果 shell 环境 中 的 一 个 成 员 既 不 可 用 set 命令 也 不 可 用 printenv 命令 显示 ， 则 这 个 变量 是 别名 。 输入 不 带 参数 的 alias 命令 
来 查看 它们 : 


一 些 有 趣 的 变量 


shell 环境 中 包含 相当 多 的 变量 ， 虽 然 你 的 shell 环境 可 能 不 同 于 这 里 展示 的 ， 但 是 你 可 能 会 看 到 以 下 变量 在 你 的 shell 环境 
中 : 


KDE_MULTIHEAD=false 

SSH_AGENT_PID=6666 

HOSTNAME=|linuxbox 

GPG_AGENT _INFO=/tmp/gpg-PdOt7g/S.gpg-agent:6689:1 

SHELL=/bin/bash 

TERM=xterm 

XDG_MENU_PREFIX=kde- 

HISTSIZE=1000 

XDG_SESSION_ COOKIE=6d7b05c65846c3eaf3101b0046bd2b00-1208521990.996705 
-1177056199 

GTK2_RC FILES=/etc/gtk-2.0/gtkrc:/home/me/.gtkrc-2.0:/home/me/.kde/sh 
are/config/gtkrc-2.0 

GTK_RC FILES=/etc/gtk/gtkrc:/home/me/.gtkrc:/home/me/.kde/share/confi 
g/gtkrc 

GS_LIB=/home/me/.fonts 

WINDOWID=29360136 

QTDIR=/usr/lib/qt-3.3 

QTINC=/usrlib/qt-3.3/include 

KDE_FULL_SESSION=true 

USER=me 
LS_COLORS=no=00:fi=00:di=00;34:In=00;36:pi=40;33:s0=00;35:bd=40;33;01 
:cd=40;33;01:or=01;05;37;41:mi=01;05;37;41:ex=00;32:\*.cmd=00;32:\*.exe: 








我 们 所 看 到 的 是 环境 变量 及 其 数值 的 列表 。 例 如 ， 我 们 看 到 一 个 叫做 USER 的 变量 ， 这 个 变量 值 是 "me"。printenv 命令 也 能 
够 列 出 特定 变量 的 数值 : 


[me@linuxbox ~]$ printenv USER 
me 


当 使 用 没有 带 选 项 和 参数 的 set 命令 时 ，shell 和 环境 变量 二 者 都 会 显示 ， 同 时 也 会 显示 定义 的 shell 函数 。 不 同 于 printenv 
命令 ，set 命 命 的 输出 结果 很 礼貌 地 按照 字母 顺序 排列 : 


[me@linuxbox ~]$ set | less 


也 可 以 通过 echo 命令 来 查看 一 个 变量 的 内 容 ， 像 这 样 : 


[me@linuxbox ~]$ echo $HOME 
/home/me 


如 果 shell 环境 中 的 一 个 成 员 既 不 可 用 set 命令 也 不 可 用 printenv 命令 显示 ， 则 这 个 变量 是 别名 。 输入 不 带 参数 的 alias 命令 
来 查看 它们 : 


[me@linuxbox ~]$ alias 

alias |.='s -d .* --color=tty' 

alias ll='|s -| --color=tty' 

alias ls='s --color=tty' 

alias vi=vVim' 

alias which='alias | /usr/bin/which --tty-only --read-alias --show-dot --show.-tilde' 





一 些 有 趣 的 变量 


shell 环境 中 包含 相当 多 的 变量 ， 虽 然 你 的 shell 环境 可 能 不 同 于 这 里 展示 的 ， 但 是 你 可 能 会 看 到 以 下 变量 在 你 的 shell 环境 
中 : 


表 12-1: 环境 变量 


六 
wl 
中 
阴 


DISPLAY 


EDITOR 
SHELL 
HOME 
LANG 
OLD_PWD 
PAGER 


PATH 


PS1 


PWD 


TERM 


TZ 


USER 


如 果 你 正在 运行 图 形 界面 环境 ， 那 么 这 个 变量 就 是 你 显示 器 的 名 字 。 通 常 ， 它 是 ":0"， 
意思 是 由 X 产生 的 第 一 个 显示 器 。 


文本 编辑 器 的 名 字 。 

shell 程序 的 名 字 。 

用 户主 目录 。 

定义 了 字符 集 以 及 语言 编 码 方式 。 
先前 的 工作 目录 。 


页 输出 程序 的 名 字 。 这 经 常设 置 为 /usr/bin/less。 





由 冒号 分 开 的 目录 列表 ， 当 你 输入 可 执行 程序 名 后 ， 会 搜索 这 个 目录 列表 。 

Prompt String 1. 这 个 定义 了 你 的 shell 提示 符 的 内 容 。 随 后 我 们 可 以 看 到 ， 这 个 变量 内 

容 可 以 全 面 地 定制 。 

当前 工作 目录 。 

六 全 
补办 区 o 


指定 你 所 在 的 时 区 。 大 多 数 类 似 于 Unix 的 系统 按照 协调 时 间 时 (UTC) 来 维护 计算 机 内 
部 的 时 钟 ， 然 后 应 用 一 个 由 这 个 变量 指定 的 偏差 来 显示 本 地 时 间 。 


你 的 用 户 名 








如 果 缺 失 了 一 些 变 量 ， 不 要 担心 ， 这 些 变量 会 因 发 行 版 本 的 不 同 而 不 同 。 


如 何 建立 shell 环境 ? 


当 我 们 登录 系统 后 ， 启动 bash 程序 ， 并 且 会 读 取 一 系列 称 为 启动 文件 的 配置 脚本 ， 这 些 文件 定义 了 默认 的 可 供 所 有 用 户 共 
享 的 shell 环境 。 然 后 是 读 取 更 多 位 于 我 们 自己 主 目录 中 的 启动 文件 ， 这 些 启 动 文件 定义 了 用 户 个 人 的 shell 环境 。 精 确 的 启 
类 型 。 有 两 种 shell 会 话 类 型 : 一 个 是 登录 shell 会 话 ， 另 一 个 是 非 登 录 shell 会 话 。 


动 顺序 依赖 于 要 运行 的 shell 会 话 








登录 shell 会 话 会 提示 用 户 输入 用 户 名 和 密码 ; 例如 ， 我 们 和 启动 一 个 虚拟 控制 台 会 话 。 当 我 们 在 GUI 模式 下 运行 终端 会 话 


时 ， 非 登录 shell 会 话 会 出 现 。 


登录 shell 会 读 取 一 个 或 多 个 启动 文件 ， 正 如 表 12 一 2 所 示 : 


文件 
/etc/proflle 
~/.bash_profile 


~/.bash_login 


~/.profile 


表 12-2: 登录 shell 会 话 的 启动 文件 
内 容 


应 用 于 所 有 用 户 的 全 局 配置 脚本 。 
用 户 私 人 的 启动 文件 。 可 以 用 来 扩展 或 重 写 全 局 配置 脚本 中 的 设置 。 
如 果 文 件 ~/.bash_profile 没有 找到 ，bash 会 尝试 读 取 这 个 脚本 。 


如 果 文 件 ~/.bash_profile 或 文件 ~/.bash_login 都 没有 找到 ，bash 会 试图 读 取 这 个 文 
件 。 这 是 基于 Debian 发 行 版 的 默认 设置 ， 比 方 说 Ubuntu。 


非 登录 shell 会 话 会 读 取 以 下 启动 文件 : 


文件 
/etc/bash.bashrc 


~/.bashrc 


表 12-3: 非 登 录 shell 会 话 的 和 启动 文件 
内 容 


应 用 于 所 有 用 户 的 全 局 配置 文件 。 
用 户 私 有 的 启动 文件 。 可 以 用 来 扩展 或 重 写 全 局 配置 脚本 中 的 设置 。 


除了 读 取 以 上 启动 文件 之 外 ， 非 登录 shell 会 话 也 会 继承 它们 父 进程 的 环境 设置 ， 通 常 是 一 个 登录 shell。 


浏览 一 下 你 的 系统 ， 看 一 看 系统 中 有 哪些 启动 文件 。 记 住 一 因为 上 面 列 出 的 大 多 数 文件 名 都 以 圆 点 开头 (意味 着 它们 是 隐藏 
文件 ) ， 你 需要 使 用 带 "-a" 选 项 的 |s 命令 。 


在 普通 用 户 看 来 ， 文 件 ~/.bashrc 可 能 是 最 重要 的 启动 文件 ， 因 为 它 几 乎 总 是 被 读 取 。 非 登录 shell 默认 会 读 取 它 ， 并 且 大 多 
数 登 录 shell 的 启动 文件 会 以 能 读 取 ~/.bashrc 文件 的 方式 来 书写 。 


一 个 启动 文件 的 内 容 


如 果 我 们 看 一 下 典型 的 .bash_profile 文件 (来 自 于 CentOS 4 系统 ) ， 它 看 起 来 像 这 样 : 


# .bash_profile 

# Get the aliases and functions 

if [ -f ~/.bashrc ]; then 

. ~/.bashrc 

fi 

# User specific environment and startup programs 
PATH=$PATH:$HOME/bin 

export PATH 


以 "#" 开 头 的 行 是 注释 ，shell 不 会 读 取 它们 。 它 们 在 那里 是 为 了 方便 人 们 阅读 。 第 一 件 有 趣 的 事情 发 生 在 第 四 行 ， 伴 随 着 以 
下 代码 : 


if [ -f ~/.bashrc ]; then 
. ~/.bashrc 
fi 


这 叫做 一 个 计 复 合 命令 ， 我 们 将 会 在 第 五 部 分 详细 地 介绍 它 ， 现 在 我 们 对 它 翻 译 一 下 : 


Ifthe file ~/.bashrc exists, then 
read the ~/.bashrc file. 


我 们 可 以 看 到 这 一 小 段 代码 就 是 一 个 登录 shell 得 到 .bashrc 文件 内 容 的 方式 。 在 我 们 和 启动 文件 中 ， 下 一 件 有 趣 的 事 与 
PATH 变量 有 关系 。 


便 经 是 否 感到 迷惑 shell 是 怎样 知道 到 哪里 找到 我 们 在 命令 行 中 输入 的 命令 的 ? 例如 ， 当 我 们 输入 ls 后 ， shell 不 会 查找 整个 
计算 机 系统 ， 来 找到 /bin/ls (ls 命令 的 绝对 路 径 名 ) ， 而 是 ， 它 查找 一 个 目录 列表 ， 这 些 目录 包含 在 PATH 变量 中 。 





PATH 变量 经 常 (但 不 总 是 ， 依 赖 于 发 行 版 ) 在 /etc/profile 启动 文件 中 设置 ， 通 过 这 些 代码 : 


PATH=$PATH:$HOME/bin 





修改 PATH 变量 ， 添 加 目录 $HOME/bin 到 目录 列表 的 末尾 。 这 是 一 个 参数 展开 的 实例 ， 参数 展开 我 们 在 第 八 章 中 提 到 过 。 


为 了 说 明 这 是 怎样 工作 的 ， 试 试 下 面 的 例子 : 


o 


[me@linuxbox ~]$ foo="This is some" 
[me@linuxbox ~]$ echo $foo 

This is some 

[me@linuxbox ~]$ foo="$foo text." 
[me@linuxbox ~]$ echo $foo 

This is some text. 





使 用 这 种 技巧 ， 我 们 可 以 把 文本 附加 到 一 个 变量 值 的 末尾 。 通 过 添加 字符 串 $HOME/bin 到 PATH 变量 值 的 末尾 ， 则 目录 
$HOME/bin 就 添加 到 了 命令 搜索 目录 列表 中 。 这 意味 着 当 我 们 想 要 在 自己 的 主 目录 下 ， 创建 一 个 目录 来 存储 我 们 自己 的 私 
人 程序 时 ，shell 已 经 给 我 们 准备 好 了 。 我 们 所 要 做 的 事 就 是 把 创建 的 目录 叫做 bin， 赶 快 行动 吧 。 








注意 : 很 多 发 行 版 默认 地 提供 了 这 个 PATH 设置 。 一 些 基 于 Debian 的 发 行 版 ， 例 如 Ubuntu， 在 登录 的 时 候 ， 会 检测 目录 
~/bin 是 否 存在 ， 若 找到 目录 则 把 它 动态 地 加 到 PATH 变量 中 。 


最 后 ， 有 下 面 一 行 代码 : 


export PATH 


这 个 export 命令 告诉 shell 让 这 个 shell 的 子 进 程 可 以 使 用 PATH 变量 的 内 容 。 


修改 shell 环境 


既然 我 们 知道 了 启动 文件 所 在 的 位 置 和 它们 所 包含 的 内 容 ， 我 们 就 可 以 修改 它们 来 定制 自己 的 shell 环境 。 


我 们 应 该 修改 哪个 文件 ? 


按照 通常 的 规则 ， 添 加 目录 到 你 的 PATH 变量 或 者 是 定义 领 外 的 环境 变量 ， 要 把 这 些 更 改 放置 到 .bash_profile 文件 中 (或 者 
其 替代 文件 中 ， 根 据 不 同 的 发 行 版 。 例 如 ，Ubuntu 使 用 .profile 文件 ) 。 对 于 其 它 的 更 改 ， 要 放 到 .bashrc 文件 中 。 除 非 你 
是 系统 管理 员 ， 需 要 为 系统 中 的 所 有 用 户 修改 默认 设置 ， 那 么 则 限定 你 只 能 对 自己 主 目录 下 的 文件 进行 修改 。 当 然 ， 有 可 能 
会 更 改 /etc 目录 中 的 文件 ， 比 如 说 profile 文件 ， 而 且 在 许多 情况 下 ， 修 改 这 些 文件 也 是 明智 的 ， 但 是 现在 ， 我 们 要 安全 起 
见 。 





文本 编辑 器 


为 了 编辑 (例如 ， 修 改 ) shell 的 启动 文件 ， 还 有 系统 中 大 多 数 其 它 配置 文件 ， 我 们 使 用 一 个 叫做 文本 编辑 器 的 程序 。 文 件 
编辑 器 是 一 个 ， 在 某 些 方面 ， 类 似 于 文字 义理 器 的 程序 ， 比 如 说 随 着 鼠标 的 移动 ， 它 允 许 你 在 屏幕 上 编辑 文字 。 只 有 一 点 ， 
文本 编辑 器 不 同 于 文字 义理 器 ， 就 是 它 只 能 支持 纯 文 本 ， 并 且 经 常 包含 为 便于 写 程 序 而 设计 的 特性 。 文 本 编辑 器 是 软件 开发 
人 员 用 来 写 代 码 ， 和 系统 管理 原 员 用 来 管理 系统 配置 文件 的 重要 工具 。 





Linux 系统 有 许多 不 同类 型 的 文本 编辑 器 可 用 ; 你 的 系统 中 可 能 已 经 安装 了 几 个 。 为 什么 会 有 这 人 么 多 种 呢 ? 可 能 因为 程序 员 
喜欢 编写 它们 ， 又 因为 程序 员 们 会 频繁 地 使 用 它们 ， 所 以 程序 员 编写 编辑 器 让 它们 按照 程序 员 自 己 的 愿望 工作 。 


文本 编辑 器 分 为 两 种 基本 类 型 : 图 形 化 的 和 基于 文本 的 编辑 器 。GNOME 和 KDE 两 者 都 包含 一 些 流行 的 图 形 编辑 器 。 
GNOME 自 带 了 一 个 叫做 gedit 的 编辑 器 ， 这 个 编辑 器 通常 在 GNOME 菜单 中 称 为 "文本 编辑 器 "。 KDE 通常 自 带 了 三 种 编辑 
器 ， 分 别 是 (按照 复杂 度 递增 的 顺序 排列 ) kedit，kwrite，kate。 

有 许多 基于 文本 的 编辑 器 。 你 将 会 遇 到 一 些 流 行 的 编辑 器 ， 它 们 是 nano，vi， 和 emacs。 这 个 nano 编辑 器 是 一 个 简单 

的 ， 容 易 使 用 的 编辑 器 ， 它 是 pico 编辑 器 的 替代 物 ，pico 编辑 器 由 PINE 邮件 套件 提供 。vi 编辑 器 (在 大 多 数 Linux 系统 
中 被 vim 替代 ，vim 是 "Vi IMproved" 的 简写 ) 是 类 似 于 Unix 操作 系统 的 传统 编辑 器 。 vim 是 我 们 下 一 章节 的 讨论 对 象 。 
emacs 编辑 器 最 初 由 Richard Stallman 写成 。emacs 是 一 个 庞大 的 ， 多 用 途 的 ， 可 做 任何 事情 的 编程 环境 。 虽 然 emacs 很 
容易 获取 ， 但 是 大 多 数 Linux 系统 很 少 默认 安装 它 。 


使 用 文本 编辑 器 


所 有 的 文本 编辑 器 都 可 以 通过 在 命令 行 中 输入 编辑 器 的 名 字 ， 加 上 你 所 想 要 编辑 的 文件 来 唤醒 。 如 果 所 输入 的 文件 名 不 存 
在 ， 编 辑 器 则 会 假定 你 想 要 创建 一 个 新 文件 。 下 面 是 一 个 使 用 gedit 的 例子 : 


[me@linuxbox ~]$ gedit some file 


这 条 命令 将 会 启动 gedit 文本 编辑 器 ， 同 时 加 载 名 为 "some_file" 的 文件 ， 如 果 这 个 文件 存在 的 话 。 
所 有 的 图 形 文本 编辑 器 都 相当 不 言 自明 的 ， 所 以 我 们 在 这 里 不 会 介绍 它们 。 反 之 ， 我 们 将 集中 精力 在 我 们 第 一 个 基于 文本 的 
文本 编辑 器 ，nano。 让 我 们 启动 nano， 并 且 编 辑 文件 .bashrc。 但 是 在 我 们 这 样 做 之 前 ， 先 练习 一 些 " 安 全 计算 "。 当 我 们 编 


辑 一 个 重要 的 配置 文件 时 ， 首 先 创 建 一 个 这 个 文件 的 各 份 总 是 一 个 不 错 的 主意 。 这 样 能 避免 我 们 在 编辑 文件 时 弄 乱 文件 。 创 
建文 件 .bashrc 的 备份 文件 ， 这 样 做 : 


[me@linuxbox ~]$ cp .bashrc .bashrc.bak 


各 份 文件 的 名 字 无 关 紧 要 ， 只 要 选择 一 个 容易 理解 的 文件 名 。 扩 展 名 ".bak"，".sav"，".old"， 和 ".orig" 都 是 用 来 指示 各 份 文 


件 的 流行 方法 。 哦 ， 记 住 cp 命令 会 默默 地 重 写 存在 的 文件 。 


现在 我 们 有 了 一 个 各 份 文件 ， 我 们 启动 nano 编辑 器 吧 : 


[me@linuxbox ~]$ nano .bashrc 





一 且 nano 编辑 器 启动 后 ， 我 们 将 会 得 到 一 个 像 下 面 一 样 的 屏幕 : 


GNU nano 2.0.3 


注意 : 如 果 你 的 系统 中 没有 安装 nano 编辑 器 ， 你 可 以 用 一 个 图 形 化 的 编辑 器 代替 。 


这 个 屏幕 由 上 面 的 标 头 ， 中 间 正 在 编辑 的 文件 文本 和 下 面 的 命令 菜单 组 成 。 因 为 设计 nano 是 为 了 代替 由 电子 邮件 客户 端 提 
供 的 编辑 器 的 ， 所 以 它 相 当 缺 乏 编辑 特性 。 在 任 一 款 编 辑 器 中 ， 你 应 该 学 习 的 第 一 个 命令 是 怎样 退出 程序 。 以 nano 为 例 ， 
你 输入 Ctrl-x 来 退出 nano。 在 屏幕 底层 的 菜单 中 说 明了 这 个 命令 。'"^X'" 表示 法 意思 是 Ctrl-x。 这 是 控制 字符 的 常见 表示 法 ， 
许多 程序 都 使 用 它 。 


第 二 个 我 们 需要 知道 的 命令 是 怎样 保存 我 们 的 劳动 成 果 。 对 于 nano 来 说 是 Ctrl-o。 尽 然 我 们 已 经 获得 了 这 些 知识 ， 接 下 来 
我 们 准备 做 些 编辑 工作 。 使 用 下 箭头 按键 和 /或 下 翻 页 按键 ， 移 动 鼠标 到 文件 的 最 后 一 行 ， 然 后 添加 以 下 几 行 到 文件 .bashrc 
中 : 


umask 0002 

export HISTCONTROL=ignoredups 
export HISTSIZE=1000 

alias |.='s -d .* --Color=auto' 
alias Ill='|s -| --Color=auto' 


注意 : 你 的 发 行 版 可 能 已 经 包含 其 中 的 一 些 行 ， 但 是 复制 没有 任何 伤害 。 


下 表 是 所 添加 行 的 意义 : 


umask 0002 设置 掩 码 来 解决 共享 目录 的 问题 。 


export 
HISTCONTROL=ignoredups 


使 得 shell 的 历史 记录 功能 忽略 一 个 命 售 ， 如 果 相 同 的 命令 已 被 记录 。 
export HISTSIZE=1000 增加 命令 历史 的 大 小 ， 从 默认 的 500 行 扩 大 到 1000 行 。 
alias |.='ls -d .* --color=auto' 创建 一 个 新 命 舍 ， 叫 做 4,， 这 个 命令 会 显示 所 有 以 点 开头 的 目录 名 。 


alias ll='ls -| --color=auto' 创建 一 个 叫做 出 的 命令 ， 这 个 命令 会 显示 长 格式 目录 列表 。 


正如 我 们 所 看 到 的 ， 我 们 的 许多 附加 物 意思 直觉 上 并 不 是 明显 的 ， 所 以 添加 注释 到 我 们 的 文件 .bashrc 中 是 一 个 好 主意 ， 可 
以 帮助 人 们 理解 。 使 用 编辑 器 ， 更 改 我 们 的 附加 物 ， 让 它们 看 起 来 像 这 样 : 


# Change umask to make directory sharing easier 
umask 0002 

# lgnore duplicates in command history and increase 
# history size to 1000 lines 

export HISTCONTROL=ignoredups 

export HISTSIZE=1000 

# Add some helpful aliases 

alias |.='s -d .* --Color=auto' 

alias ll='ls -| --color=auto' 


啊 ， 看 起 来 好 多 了 ! 当 我 们 完成 修改 后 ， 输 入 Ctrl-o 来 保存 我 们 修改 的 .bashrc 文件 ， 输 入 Ctrl-x 退出 nano。 


为 什么 注释 很 重要 ? 





不 管 什么 时 候 你 修改 配置 文件 时 ， 给 你 所 做 的 更 改 加 上 注释 都 是 一 个 好 主意 。 的 确 ， 明 天 你 会 记得 你 修改 了 的 内 容 ， 
但 是 六 个 月 之 后 会 怎样 呢 ? 帮 有 自己 一 个 忙 ， 加 上 一 些 注释 吧 。 当 你 意识 到 这 一 点 后 ， 对 你 所 做 的 修改 做 个 日 志 是 个 不 
错 的 主意 。 








Shell 脚本 和 bash 启动 文件 都 使 用 "#" 符号 来 开始 注释 。 其 它 配置 文件 可 能 使 用 其 它 的 符号 。 大 多 数 配置 文件 都 有 注 
释 。 把 它们 作为 指南 。 





你 会 经 常 看 到 配置 文件 中 的 一 些 行 被 注释 掉 ， 以 此 防止 它们 被 受 影响 的 程序 使 用 。 这 样 做 是 为 了 给 读者 在 可 能 的 配置 
上 cf 


选项 方面 一 些 建议 ， 或 者 给 出 正确 的 配置 语法 实例 。 例 如 ，Ubuntu 8.04 中 的 .bashrc 文件 包含 这 些 行 : 


# some more ls aliases 
#alias ll="'|s -| 
#alias 1a='s -A' 
#alias |='s -CF' 


最 后 三 行 是 有 效 的 被 注释 掉 的 别名 定义 。 如 果 你 删除 这 三 行 开头 的 '#" 符号 ， 此 技术 程 称 为 uncommenting (不 注释 )， 
这 样 你 就 会 激活 这 些 别 名 。 相 反 地 ， 如 果 你 在 一 行 的 开头 加 上 "#" 符号 ， 你 可 以 注销 掉 这 一 行 ， 但 会 保留 它 所 包含 的 








开 | 
谴 


激活 我 们 的 修改 


我 们 对 于 文件 .bashrc 的 修改 不 会 生效 ， 直 到 我 们 关闭 终端 会 话 ， 再 重新 启动 一 个 新 的 会 话 ， 因为 .bashrc 文件 只 是 在 刚 开 
始 启 动 终端 会 话 时 读 取 。 然 而 ， 我 们 可 以 强迫 bash 重新 读 取 修 改过 的 .bashrc 文件 ， 使 用 下 面 的 命令 : 


[me@linuxbox ~]$ source .bashrc 
运行 上 面 命令 之 后 ， 我 们 就 应 该 能 够 看 到 所 做 修改 的 效果 了 。 试 试 其 中 一 个 新 的 别名 : 


[me@linuxbox ~]$1l 


总 结 


ANSA 


在 这 一 章 中 ， 我 们 学 到 了 用 文本 编辑 器 来 编辑 配置 文件 的 必要 技巧 。 随 着 继续 学 习 ， 当 我 们 读 到 命令 的 手册 页 时 ， 记 录 下 命 
今 所 支持 的 环境 变量 。 可 能 会 有 一 个 或 两 个 宝贝 。 在 随后 的 章节 里 面 ， 我 们 将 会 学 习 shell 范 数 ， 一 个 很 强大 的 特性 ， 你 可 
以 把 它 包 含 在 bash 启动 文件 里 面 ， 以 此 来 添加 你 自 定 制 的 命令 宝库 。 


拓展 阅读 


bash 手册 页 的 INVOCATION 部 分 非常 详细 地 讨论 了 bash 启动 文件 。 


Vi 简介 


有 一 个 古老 的 笑话 ， 说 是 一 个 在 纽约 的 游客 向 行人 打听 这 座 城市 中 著名 古典 音乐 场馆 的 方向 : 

游客 : 请 问 一 下 ， 我 怎样 去 卡 内 基 音 乐 大 厅 ? 

行人 : 练习 ， 练 习 ， 练 习 ! 

学 习 Linux 命 合 行 ， 就 像 要 成 为 一 名 造 话 很 深 的 钢琴 家 一 样 ， 它 不 是 我 们 一 下 午 就 能 学 会 的 技能 。 这 需要 经 历 几 年 的 勤 苦 练 
习 。 在 这 一 章 中 ， 我 们 将 介绍 vi (发 音 “Vee eye”) 文本 编辑 器 ， 它 是 Unix 传统 中 核心 程序 之 一 。 vi 因 它 难 用 的 用 户 界面 而 


有 点 声名 狼藉 ， 但 是 当 我 们 看 到 一 位 大 病 坐 在 钢琴 前 开始 演奏 时 ， 我 们 的 确 成 了 伟大 艺术 的 见证 人 。 虽 然 我 们 在 这 里 不 能 
为 Vi 大病， 但 是 当 我 们 学 完 这 一 章 后 ， 我 们 会 知道 怎样 在 vi 中 玩 "第 子 ”。 


为 什么 我 们 应 该 学 习 Vi 


在 现在 这 个 图 形 编辑 器 和 易于 使 用 的 基于 文本 编辑 器 的 时 代 ， 比 如 说 nano， 为 什么 我 们 还 应 该 学 习 vi 呢 ? 下 面 有 三 个 充分 
的 理由 : 


e vi 很 多 系统 都 预 装 。 如 果 我 们 的 系统 没有 图 形 界 面 ， 比 方 说 一 台 远 端 服务 器 或 者 是 一 个 X 配置 损坏 了 的 本 地 系统 ， 那 么 
vi 就 成 了 我 们 的 救星 。 虽 然 nano 逐渐 流行 起 来 ， 但 是 它 还 没有 普及 。POSIX， 这 套 Unix 系统 中 程序 兼容 的 标准 ， 就 
要 求 系 统 要 预 装 vi。 

e vi 是 轻 量 级 且 执 行 快速 的 编辑 器 。 对 于 许多 任务 来 说 ， 启 动 vi 比 起 在 菜单 中 找到 一 个 图 形 化 文本 编辑 器 ， 再 等 待 编辑 器 
数 倍 兆 字 节 的 数据 加 载 而 言 ， 要 容易 的 多 。 另 外 ，Vvi 是 为 了 加 快 输入 速度 而 设计 的 。 我 们 将 会 看 到 ， 当 一 名 熟练 的 vi 用 
户 在 编辑 文件 时 ， 他 或 她 的 手 从 不 需要 移 开 键盘 。 

e 我 们 不 希望 其 他 Linux 和 Unix 用 户 把 我 们 看 作 胆 小 鬼 。 

好 吧 ， 可 能 只 有 两 个 充分 的 理由 。 

一 点 儿 背 景 介 绍 


VAN 


第 一 版 vi 是 在 1976 由 Bill Joy 写成 的 ， 当 时 他 是 加 州 大 学 伯克利 分 校 的 学 生 ， 后 来 他 共同 创建 了 Sun 微 系统 公司 。vi 这 个 
名 字 来 源 于 单词 "visual"， 因 为 它 打算 在 带 有 可 移动 光标 的 视频 终端 上 编辑 文本 。 在 发 明 可 视 化 编辑 器 之 前 ， 有 一 次 只 能 操 
作 一 行文 本 的 行 编辑 器 。 为 了 指定 一 个 修改 ， 我 们 告诉 行 编辑 器 到 一 个 特殊 行 并 且 说 明 做 什么 修改 ， 上 比方 说 添加 或 删除 文 
本 。 视 频 终 端 (而 不 是 基于 打印 机 的 终端 ， 像 电 传 打 印 机 ) 的 出 现 ， 可 视 化 编辑 成 为 可 能 。vi 实际 上 整合 了 一 个 强大 的 叫做 
ex 行 编辑 器 , 所 以 我 们 在 使 用 vi 时 能 运行 行 编辑 命令 。 

大 多 数 Linux 发 行 版 不 包含 真正 的 vi ; 而 是 自 带 一 款 高 级 替代 版 本 ， 叫 做 vim ( 它 是 “vi improved” 的 简写 ) 由 Bram 
Moolenaar 开发 的 。vim 相对 于 传统 的 Unix vi 来 说 ， 取 得 了 实质 性 进步 。 通 常 ，vim 在 Linux 系统 中 是 “Vi” 的 符号 链接 (或 
别名 ) 。 在 随后 的 讨论 中 ， 我 们 将 会 假定 我 们 有 一 个 叫做 "vi" 的 程序 ， 但 它 其 实 是 vim。 


启动 和 停止 Vi 


要 想 和 启动 vi， 只 要 简单 地 输入 以 下 命令 : 
[me@linuxbox ~]$ vi 
一 个 像 这 样 的 屏幕 应 该 出 现 : 


VIM - Vi Improved 


正如 我 们 之 前 操作 nano 时 ， 首 先 要 学 的 是 怎样 退出 vi。 要 退出 vi， 输 入 下 面 的 命令 〈 注 意 冒 号 是 命令 的 一 部 分 ) 


shell 提示 符 应 该 返回 。 如 果 由 于 某 种 原因 ，vi 不 能 退出 〈 通 常 因为 我 们 对 文件 做 了 修改 ， 却 没有 保存 文件 ) 。 通过 给 命令 
加 上 叹 号 ， 我 们 可 以 告诉 vi 我 们 真 要 退出 vi。 


:q! 


小 贴 示 : 如 果 你 在 vi 中 “迷失 "了 ， 试 着 按 下 Esc 键 两 次 来 找到 路 ( 回 到 普通 模式 ) 。 


兼容 模式 





上 面 实例 中 的 启动 屏幕 (来自 于 Ubuntu 8.04) ， 我 们 看 到 一 行文 字 “ 以 Vi 兼容 的 模式 运行 "。 这 意味 着 vim 将 以 近似 
于 vi 常规 的 模式 运行 ， 而 不 是 vim 的 高 级 规范 。 为 了 这 章 的 目的 ， 我 们 想 要 使 用 vim 的 高 级 规范 。 要 想 这 样 做 ， 你 
有 几 个 选择 : 








用 vim 来 代替 vi。 


如 果 命令 生效 ， 考 虑 在 你 的 .bashrc 文件 中 添加 别名 vi=vim'。 





或 者 ， 使 用 这 个 命令 在 你 的 vim 配置 文件 中 添加 一 行 : 


echo "set nocp" >> ~/.vimrc 








不 同 的 Linux 发 行 版 其 vim 软件 包 也 包 然 不 同 。 一 些 发 行 版 只 是 安装 了 vim 的 最 小 版 本 ， 其 默认 只 支持 有 限 的 vim 特 
性 。 当 练习 随后 的 课程 时 ， 你 可 能 会 遇 到 缺失 的 功能 。 如 果 是 这 种 情况 ， 就 安装 vim 的 完整 版 。 


编辑 模式 
再 次 启动 vi， 这 次 传递 给 vi 一 个 不 存在 的 文件 名 。 这 也 是 用 vi 创建 新 文件 的 方法 。 


[me@linuxbox ~]$ rm -ffoo.txt 
[me@linuxbox ~]$ vi foo.txt 


如 果 一 切 运行 正常 ， 我 们 应 该 获得 一 个 像 这 样 的 屏幕 : 


"foo.txt" [New File] 


每 行 开头 的 波浪 号 ("~") 指示 那 一 行 不 存在 文本 。 这 表示 我 们 有 一 个 空 文件 。 还 没有 输入 任何 字符 ? 


学 习 vi 时 ， 要 知道 的 第 二 件 非常 重要 的 事情 是 (知道 了 如 何 退 出 vi 后 ) vi 是 一 个 模式 编辑 器 。 当 vi 启动 后 ， 进 入 的 是 命令 
模式 。 这 种 模式 下 ， 几 乎 每 个 按键 都 是 一 个 命令 ， 所 以 如 果 我 们 打算 输入 字符 ，vi 会 发 疯 ， 弄 得 一 团 糟 。 


插入 模式 


为 了 在 文件 中 添加 文本 ， 首 先 我 们 必须 进入 插入 模式 。 按 下 小 按键 进入 插入 模式 。 之 后 ， 我 们 应 该 在 屏幕 底部 看 到 下 面 一 
行 ， 如 果 vi 运行 在 高 级 模式 下 (这 不 会 出 现在 vi 兼容 模式 下 ) 


-- INSERT -- 


现在 我 们 能 输入 一 些 文 本 了 。 试 着 输入 这 些 文本 : 


The quick brown foxjumped over the lazy dog. 


按 下 Esc 按键 ， 退 出 插入 模式 并 返回 命 全 模式 。 
保存 我 们 的 工作 


为 了 保存 我 们 刚才 对 文件 所 做 的 修改 ， 我 们 必须 在 命令 模式 下 输入 一 个 ex 命令 。 通过 按 下 "* 键 ， 这 很 容易 完成 。 按 下 冒号 
键 之 后 ， 一 个 冒号 字符 应 该 出 现在 屏幕 的 底部 : 


为 了 写 入 我 们 修改 的 文件 ， 我 们 在 冒号 之 后 输入 "w" 字 符 ， 然 后 按 下 回 车 键 : 





文件 将 会 写 和 到 硬盘 ， 并 且 我 们 应 该 在 屏幕 底部 得 到 一 个 确认 信息 ， 就 像 这 样 : 
"foo.txt" [New] 1L 46C written 
小 贴 示 : 如 果 你 阅读 vim 的 文档 ， 你 注意 到 (混淆 地 ) 命令 模式 被 叫做 普通 模式 ，ex 命令 叫做 命令 模式 。 当 心 。 
移动 光标 
当 在 vi 命令 模式 下 时 ，vi 提供 了 大 量 的 移动 命令 ， 其 中 一 些 是 与 less 阅读 器 共享 的 。 这 里 列举 了 一 些 : 


表 13-1: 光标 移动 按键 


按键 移动 光标 
1or 右 箭 头 向 右 移动 一 个 字符 
h or 左 箭头 向 左 移动 一 个 字符 
j or 下 箭头 向 下 移动 一 行 
k or 上 箭头 向 上 移动 一 行 
0 ( 堆 按 键 ) 移动 到 当前 行 的 行 首 。 
A 移动 到 当前 行 的 第 一 个 非 空 字符 。 
$ 移动 到 当前 行 的 末尾 。 
w 移动 到 下 一 个 单词 或 标点 符号 的 开头 。 
W 移动 到 下 一 个 单词 的 开头 ， 忽 略 标点 符号 。 
b 移动 到 上 一 个 单词 或 标点 符号 的 开头 。 
B 移动 到 上 一 个 单词 的 开头 ， 忽 略 标点 符号 。 
Ctrl-for Page Down 向 下 翻 一 页 
Ctrl-b or Page Up 向 上 翻 一 页 
numberG 移动 到 第 number 行 。 例 如 ，1G 移动 到 文件 的 第 一 行 。 
G 移动 到 文件 末尾 。 


为 什么 h，j，Kk， 和 上 1 按键 被 用 来 移动 光标 呢 ? 因为 在 开发 vi 之 初 ， 并 不 是 所 有 的 视频 终端 都 有 箭头 按键 ， 熟 练 的 打字 员 可 
以 使 用 规则 的 键盘 按键 来 移动 光标 ， 他 们 的 手 从 不 需要 移 开 键盘 。 


vi 中 的 许多 命令 都 可 以 在 前 面 加 上 一 个 数字 ， 比 方 说 上 面 提 到 的 "G'" 命 令 。 在 命令 之 前 加 上 一 个 数字 ， 我 们 就 可 以 指定 命令 
执行 的 次 数 。 例 如 ， 命 令 "5j "导致 vi 向 下 移动 5 行 。 


基本 编辑 

大 多 数 编辑 工作 由 一 些 基本 的 操作 组 成 ， 比 如 说 插入 文本 ， 删 除 文本 和 通过 剪 切 和 粘贴 来 移动 文本 。 vi， 当 然 ， 以 它 自己 的 
独特 方式 来 支持 所 有 的 操作 。vi 也 提供 了 有 限 的 撤销 形式 。 如 果 我 们 按 下 "u" 按键 ， 当 在 命令 模式 下 ，vi 将 会 撤销 你 所 做 的 最 
后 一 次 修改 。 当 我 们 试 着 执行 一 些 基本 的 编辑 命 合 时 ， 这 会 很 方便 。 

追加 文本 

vi 有 几 种 不 同 进入 插入 模式 的 方法 。 我 们 已 经 使 用 了 i 命令 来 插入 文本 。 


让 我 们 返回 到 我 们 的 foo.txt 文件 中 ， 呆 一 会 儿 : 


The quick brown fox jumped over the lazy dog. 


如 果 我 们 想 要 在 这 个 句子 的 末尾 添加 一 些 文本 ， 我 们 会 发 现 i 命令 不 能 完成 任务 ， 因 为 我 们 不 能 把 光标 移 到 行 尾 。vi 提供 了 
追加 文本 的 命令 ， 明 智 地 命名 为 "a" 命 伟 。 如 果 我 们 把 光标 移动 到 行 尾 ， 输 入 "a", 光标 就 会 越过 行 尾 ，vi 进入 插入 模式 。 这 样 
就 允许 我 们 添加 更 多 的 文本 : 





The quick brown foxjumped over the lazy dog. It was cool. 


记 住 按 下 Esc 按键 来 退出 插入 模式 。 


因为 我 们 几乎 总 是 想 要 在 行 尾 附 加 文本 ， 所 以 vi 提供 了 一 种 快捷 方式 来 移动 到 当前 行 的 末尾 ， 并 且 能 添加 文本 。 它 是 "A' 命 
令 。 试 着 用 一 下 它 ， 给 文件 添加 更 多 行 。 


首先 ， 使 用 "0"( 雾 ) 命 售 ， 将 光标 移动 到 行 首 。 现 在 我 们 输入 "A"， 来 添加 以 下 文本 行 : 


The quick brown foxjumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 





再 一 次 ， 按 下 Esc 按键 退出 插入 模式 。 


正如 我 们 所 看 到 的 ， 大 A 命令 非常 有 用 ， 因 为 在 启动 插入 模式 之 前 ， 它 把 光标 移动 了 行 尾 。 
打 姑 二 行 


我 们 插入 文本 的 另 一 种 方式 是 “打开 "一 行 。 这 会 在 存在 的 两 行 之 间 插 入 一 个 空白 行 ， 并 且 进 入 插入 模式 。 这 种 方式 有 两 个 变 


表 13-2: 文本 行 打开 按键 


命 兮 打开 行 
0 当前 行 的 下 方 打开 一 行 。 
O 当前 行 的 上 方 打开 一 行 。 


我 们 可 以 演示 一 下 : 把 光标 放 到 "Line 3" 上 ， 按 下 小 o 按键 。 


The quick brown foxjumped over the lazy dog. It was cool. 
Line 2 
Line 3 


line 4 
line 5 





在 第 三 行 之 下 打开 了 新 的 一 行 ， 并 且 进 入 插入 模式 。 按 下 Esc， 退 出 插入 模式 。 按 下 u 按键 ， 撤 销 我 们 的 修改 。 


按 下 大 O 按键 在 光标 之 上 打开 新 的 一 行 : 


The quick brown foxjumped over the lazy dog. It was cool. 
Line 2 


Line 3 


Line 4 
Line 5 


按 下 Esc 按键 ， 退 出 插入 模式 ， 并 且 按 下 u 按键 ， 撤 销 我 们 的 更 改 。 


删除 文本 


正如 我 们 期 望 的 ，vi 提供 了 各 种 各 样 的 方式 来 删除 文本 ， 所 有 的 方式 包含 一 个 或 两 个 按键 。 首 先 ， x 按键 会 删除 光标 位 置 的 
一 个 字符 。 可 以 在 x 命令 之 前 带 上 一 个 数字 ， 来 指明 要 删除 的 字符 个 数 。 d 按键 更 通用 一 些 。 类 似 x 命令 ，d 命令 之 前 可 以 
带 上 一 个 数字 ， 来 指定 要 执行 的 删除 次 数 。 另 外 ， d 命令 之 后 总 是 带 上 一 个 移动 命 售 ， 用 来 控制 删除 的 范围 。 这 里 有 些 实 
例 : 


表 13-3: 文本 删除 命 今 


命 兮 删除 的 文本 
x 当前 字符 
3x 当前 字符 及 其 后 的 两 个 字符 。 
dd 当前 行 。 
5dd 当前 行 及 随后 的 四 行文 本 。 
dW 从 光标 位 置 开始 到 下 一 个 单词 的 开头 。 
d$ 从 光标 位 置 开 始 到 当前 行 的 行 尾 。 
d0 从 光标 位 置 开 始 到 当前 行 的 行 首 。 
d^ 从 光标 位 置 开 始 到 文本 行 的 第 一 个 非 空 字符 。 
dG 从 当前 行 到 文件 的 末尾 。 
d20G 从 当前 行 到 文件 的 第 20 行 。 


把 光标 放 到 第 一 行 单 词 “ 心 之 上 。 重 复 按 下 x 按键 直到 删除 剩 下 的 部 分 。 下 一 步 ， 重 复 按 下 Uu 按键 直到 恢复 原貌 。 


注意 : 真正 的 vi 只 是 支持 单 层面 的 undo 命令 。vim 则 支持 多 个 层面 的 。 





我 们 再 次 执行 删除 命 舍 ， 这 次 使 用 d 命 伟 。 还 是 移动 光标 到 单词 " 心 之 上 ， 按 下 的 dW 来 删除 单词 : 


The quick brown foxjumped over the lazy dog. was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


按 下 d$ 删 除 从 光标 位 置 到 行 尾 的 文本 : 


The quick brown foxjumped over the lazy dog. 
Line 2 
Line 3 
Line 4 
Line 5 


按 下 dG 按键 删除 从 当前 行 到 文件 末尾 的 所 有 行 : 


连续 按 下 U 按键 三 次 ， 来 恢复 删除 部 分 。 


切 ， 复 制 和 粘贴 文本 


性 


兮 不 仅 删 除 文本 ， 它 还 " 剪 切 "文本 。 每 次 我 们 使 用 d 命令 ， 删 除 的 部 分 被 复制 到 一 个 粘贴 缓冲 区 中 (看 作 瘟 切 
板 ) 。 过 后 我 们 执行 小 p 命令 把 剪 切 板 中 的 文本 粘贴 到 光标 位 置 之 后 ， 或 者 是 大 P 命令 把 文本 粘贴 到 光标 之 前 。 


命令 用 来 " 拉 ”(〈 复 制 ) 文本 ， 和 d 命 邻 剪 切 文本 的 方式 差不多 。 这 里 有 些 把 y 命 合 和 各 种 移动 命令 结合 起 来 使 用 的 实例 : 


< 


表 13-4: 复制 命令 


命 合 复制 的 内 容 
yy 当前 行 。 
5yy 当前 行 及 随后 的 四 行文 本 。 
yw 从 当前 光标 位 置 到 下 一 个 单词 的 开头 。 
y$ 从 当前 光标 位 置 到 当前 行 的 末尾 。 
y0 从 当前 光标 位 置 到 行 首 。 
yA^ 从 当前 光标 位 置 到 文本 行 的 第 一 个 非 空 字符 。 
yG 从 当前 行 到 文件 末尾 。 
y20G 从 当前 行 到 文件 的 第 20 行 。 





我 们 试 着 做 些 复制 和 粘贴 工作 。 把 光标 放 到 文本 第 一 行 ， 输 入 yy 来 复制 当前 行 。 下 一 步 ， 把 光标 移动 最 后 一 行 (G) ， 输 入 
小 写 的 p 把 复制 的 一 行 粘贴 到 当前 行 的 下 面 : 





The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 
The quick brown fox jumped over the lazy dog. It was cool. 


和 以 前 一 样 ，u 命令 会 撤销 我 们 的 修改 。 光 标 仍然 位 于 文件 的 最 后 一 行 ， 输 入 大 写 的 P 命令 把 所 复制 的 文本 粘贴 到 当前 行 之 
Es 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 
The quick brown fox jumped over the lazy dog. It was cool. 


试 着 执行 上 表 中 一 些 其 他 的 y 命令 ， 了 解 小 写 p 和 大 写 P 命 合 的 行为 。 当 你 完成 练习 之 后 ， 把 文件 恢复 原样 。 


连接 行 


vi 对 于 行 的 概念 相当 严格 。 通 常 ， 不 可 能 把 光标 移 到 行 尾 ， 再 删除 行 尾 结束 符 ( 回 车 符 ) 来 连接 当前 行 和 它 下 面 的 一 行 。 由 
于 这 个 原因 ，vi 提供 了 一 个 特定 的 命令 ， 大 写 的 ] 〈 不 要 与 小 写 的 j 混淆 了 ，j 是 用 来 移动 光标 的 ) 把 行 与 行 之 间 连 接 起 来 。 








如 果 我 们 把 光标 放 到 line 3 上 ， 输 入 大 写 的 J 命令， 看 看 发 生 什 么 情况 : 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 

Line 3 Line 4 

Line 5 


查找 和 蔡 换 


vi 有 能 力 把 光标 移 到 搜索 到 的 匹配 项 上 。vi 可 以 在 单一 行 或 整个 文件 中 运用 这 个 功能 。 它 也 可 以 在 有 或 没有 用 户 确认 的 情况 
下 实现 文本 替换 。 


查找 一 行 


f 命令 查找 一 行 ， 移 动 光标 到 下 一 个 所 指定 的 字符 上 。 例 如 ， 命 令 fa 会 把 光标 定位 到 同一 行 中 下 一 个 出 现 的 "a" 字 符 上 。 在 一 
行 中 执行 了 字符 的 查找 命令 之 后 ， 通 过 输入 分 号 来 重复 这 个 查找 。 


查找 整个 文件 


移动 光标 到 下 一 个 出 现 的 单词 或 短语 上 ， 使 用 /命令 。 这 个 命令 和 我 们 之 前 在 less 程序 中 学 到 的 一 样 。 当 你 输入 /命令 后 ， 一 
个 /字符 会 出 现在 屏幕 底部 。 下 一 步 ， 输 入 要 查找 的 单词 或 短语 后 ， 按 下 回 车 。 光 标 就 会 移动 到 下 一 个 包含 所 查找 字符 串 的 
位 置 。 通 过 n 命令 来 重复 先前 的 查找 。 这 里 有 个 例子 : 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


把 光标 移动 到 文件 的 第 一 行 。 输 入 : 
/Line 


然后 键入 回 车 。 光 标 会 移动 到 第 二 行 。 下 一 步 ， 输 入 n， 光 标 移 到 第 三 行 。 重 复 这 个 n 命令 ， 光 标 会 继续 向 下 移动 直到 通 历 
了 所 有 的 匹配 项 。 虽 然 目 前 ， 我 们 只 是 使 用 了 单词 和 短语 来 作为 我 们 的 查找 模式 ， 但 是 vi 允许 使 用 正则 表达 式 ， 一 种 强大 的 
用 来 表示 复 末 文本 模式 的 方法 。 我 们 将 会 在 随后 的 章节 里 面 详尽 地 介绍 正则 表达 式 。 





全 局 查找 和 蔡 代 


vi 使 用 ex 命令 来 执行 查找 和 蔡 代 操 作 (vi 中 叫做 “替换 "”) 。 把 整个 文件 中 的 单词 "Line" 更 改 为 "ine"， 我 们 输入 以 下 命令 : 
:%s/Line/line/g 


我 们 把 这 个 命令 分 解 为 几 个 单独 的 部 分 ， 看 一 下 每 部 分 的 含义 : 


条 目 含义 
[3 


冒号 字符 运行 一 个 ex 命 合 。 


指定 要 操作 的 行 数 。% 是 一 个 快捷 方式 ， 表 示 从 第 一 行 到 最 后 一 行 。 另 外 ， 操 作 范 围 也 


% 可 以 用 1.5 来 代替 (因为 我 们 的 文件 只 有 5 行文 本 ) ， 或 者 用 1.$ 来 代替 ， 意 思 是 “从 第 
一 行 到 文件 的 最 后 一 行 。" 如 果 省 略 了 文本 行 的 范围 ， 那 么 操作 只 对 当前 行 生效 。 


s 指定 操作 。 在 这 种 情况 下 是 ， 蔡 换 (查找 与 替代 ) 。 
/Line/line 查找 类 型 与 替代 文本 。 

这 是 “全 局 "的 意思 ， 意 味 着 对 文本 行 中 所 有 匹配 的 字符 串 执行 查找 和 蔡 换 操作 。 如 果 省 略 
9 g， 则 只 替换 每 个 文本 行 中 第 一 个 匹配 的 字符 串 。 


执行 完 查 找 和 替代 命 合 之 后 ， 我 们 的 文件 看 起 来 像 这 样 





The quick brown fox jumped over the lazy dog. It was cool. 
line 2 
line 3 
line 4 
line5 


我 们 也 可 以 指定 一 个 需要 用 户 确认 的 替换 命令 。 通 过 添加 一 个 "c' 字 符 到 这 个 命令 的 末尾 ， 来 完成 这 个 替换 命令 。 例 如 : 


:%s/line/Line/gc 


这 个 命令 会 把 我 们 的 文件 恢复 先前 的 模样 ; 然而 ， 在 执行 每 个 替换 命令 之 前 ，vi 会 停 下 来 ， 通过 下 面 的 信息 ， 来 要 求 我 们 确 
认 这 个 替换 : 


replace with Line (y/n/a/q/l/~^E/~^Y)? 


括号 中 的 每 个 字符 都 是 一 个 可 能 的 选择 ， 如 下 所 示 : 


表 13-5: 替换 确认 按键 


按键 行为 
y 执行 替换 操作 
n 跳 过 这 个 匹配 的 实例 
a 对 这 个 及 随后 所 有 匹配 的 字符 串 执行 替换 操作 。 
d or esc 退出 替换 操作 。 
| 执行 这 次 替换 并 退出 。| 是 “last 的 简写 。 
Ctrl-e, Ctrl-y 分 别 是 向 下 滚动 和 向 上 滚动 。 用 于 查看 建议 替换 的 上 下 文 。 


如 果 你 输入 y， 则 执行 这 个 替换 ， 输 入 mn 则 会 导致 vi 跳 过 这 个 实例 ， 而 移 到 下 一 个 匹配 项 上 。 
编辑 多 个 文件 


同时 能 够 编辑 多 个 文件 是 很 有 用 的 。 你 可 能 需要 更 改 多 个 文件 或 者 从 一 个 文件 复制 内 容 到 另 一 个 文件 。 通 过 vi， 我 们 可 以 打 
开 多 个 文件 来 编辑 ， 只 要 在 命令 行 中 指定 要 编辑 的 文件 名 。 


vi filel file2 file3... 


我 们 先 退 出 已 经 存在 的 vi 会 话 ， 然 后 创建 一 个 新 文件 来 编辑 。 输 入 :wd 来 退出 vi 并 且 保 存 了 所 做 的 修改 。 下 一 步 ， 我 们 将 在 
主 目录 下 创建 一 个 额外 的 用 来 玩 要 的 文件 。 通 过 获取 从 |s 命令 的 输出 ， 来 创建 这 个 文件 。 








[me@linuxbox ~]$ Is -| /usr/bin > ls-output.txt 


用 vi 来 编辑 我 们 的 原文 件 和 新 创建 的 文件 : 


[me@linuxbox ~]$ vi foo.txt Is-output.txt 


vi 启动 ， 我 们 会 看 到 第 一 个 文件 显示 出 来 : 


The quick brown fox jumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


文件 之 间 转 换 


从 这 个 文件 转 到 下 一 个 文件 ， 使 用 这 个 ex 命令 : 


回 到 先前 的 文件 使 用 : 


当 我 们 从 一 个 文件 移 到 另 一 个 文件 时 ， 如 果 当 前 文件 没有 保存 修改 ，vi 会 阻止 我 们 转换 文件 ， 这 是 vi 强制 执行 的 政策 。 在 命 
今 之 后 添加 感叹 号 ， 可 以 强迫 vi 放弃 修改 而 转换 文件 。 


另外 ， 上 面 所 描述 的 转换 方法 ，vim (和 一 些 版 本 的 vi) 也 提供 了 一 些 ex 命令 ， 这 些 命令 使 多 个 文件 更 容易 管理 。 我 们 可 以 
查看 正在 编辑 的 文件 列表 ， 使 用 :buffers 命令 。 运 行 这 个 命令 后 ， 屏 幕 项 部 就 会 显示 出 一 个 文件 列表 : 





:buffers 
I foontxt line 1 
2 %a "ls-output.txt" line 0 


Press ENTER or type command to continue 


注意 : 你 不 同 通过 :n 或 :N 命令 在 由 :e 命令 加 载 的 文件 之 间 进 行 切换 。 这 时 要 使 用 :buffer 命令 ， 其 后 加 上 缓冲 区 号 码 ， 来 转 
换文 件 。 


从 一 个 文件 复制 内 容 到 另 一 个 文件 


当 我 们 编辑 多 个 文件 时 ， 经 常 地 要 复制 文件 的 一 部 分 到 另 一 个 正在 编辑 的 文件 。 使 用 之 前 我 们 学 到 的 拉 (yank) 和 粘贴 命 
今 ， 这 很 容易 完成 。 说 明 如 下 。 以 打开 的 两 个 文件 为 例 ， 首 先 转换 到 缓冲 区 1 (foo.txt) ， 输 入 : 


:buffer 1 


我 们 应 该 得 到 以 下 输出 : 


The quick brown foxjumped over the lazy dog. It was cool. 
Line 2 
Line 3 
Line 4 
Line 5 


下 一 步 ， 把 光标 移 到 第 一 行 ， 并 且 输 入 yy 来 复制 这 一 行 。 


转换 到 第 二 个 缓冲 区 ， 输 入 : 
:buffer 2 
现在 屏幕 会 包含 一 些 文件 列表 (这 里 只 列 出 了 一 部 分 ) 


total 343700 
-rwWxr-xr-x 1 root root 31316 2007-12-05 08:58[ 


移动 光标 到 第 一 行 ， 输 入 p 命令 把 我 们 从 前 面 文件 中 复制 的 一 行 粘贴 到 这 个 文件 中 : 


total 343700 
The quick brown fox jumped over the lazy dog. It was cool. 
-rWXxr-xr-x 1 root root 31316 2007-12-05 08:58 [ 


插入 整个 文件 到 另 一 个 文件 


也 有 可 能 把 整个 文件 插入 到 我 们 所 编辑 的 文件 中 。 看 一 下 实际 操作 ， 结 束 vi 会话， 重新 启动 一 个 只 打开 一 个 文件 的 vi 会 
话 : 


[me@linuxbox ~]$ vi ls-output.txt 





再 一 次 看 到 我 们 的 文件 列表 : 


total 343700 
-rWXxr-xr-x 1 root root 31316 2007-12-05 08:58 [ 


移动 光标 到 第 三 行 ， 然 后 输入 以 下 ex 命令 : 


S00tXE 





这 个 :r 命 合 (是 "read" 的 简称 ) 把 指定 的 文件 插入 到 光标 位 置 之 前 。 现 在 屏幕 应 该 看 起 来 像 这 样 : 


total 343700 
-rWxr-xr-x 1 root root 31316 2007-12-05 08:58 [ 


The quick brown foxjumped over the lazy dog. It was cool. 
Line 2 

Line 3 

Line 4 

Line 5 

-rwWxr-xr-x 1 root root 111276 2008-01-31 13:36 a2p 


保存 工作 


像 vi 中 的 其 它 操 作 一 样 ， 有 几 种 不 同 的 方法 来 保存 我 们 所 修改 的 文件 。 我 们 已 经 研究 了 :Ww 这 个 ex 命令 ， 但 还 有 几 种 方法 ， 
可 能 我 们 也 觉得 有 帮助 。 


在 命令 模式 下 ， 输 入 ZZ 就 会 保存 并 退出 当前 文件 。 同 样 地 ，ex 命令 :wd 把 :w 和 :9 命令 结合 到 一 起 ， 来 完成 保存 和 退出 任 
务 。 


这 个 :w 命令 也 可 以 指定 可 选 的 文件 名 。 这 个 的 作用 就 如 "Save As..."。 例 如 ， 如 果 我 们 正在 编辑 foo.txt 文件 ， 想 要 保存 一 个 
副本 ， 叫 做 foo1.txt， 那 么 我 们 可 以 执行 以 下 命令 : 


:W fool.txt 


注意 : 当 上 面 的 命令 以 一 个 新 名 字 保 存 文件 时 ， 但 它 并 没有 更 改 你 正在 编辑 的 文件 的 名 字 。 如 果 你 继续 编辑 的 话 ， 你 还 是 在 
编辑 文件 foo.txt， 而 不 是 foo1 .txt。 


拓展 阅读 


即使 把 这 章 所 学 的 内 容 都 加 起 来 ， 我 们 也 只 是 学 了 vi 和 vim 的 一 点 儿 皮 毛 而 已 。 这 里 有 一 些 在 线 的 资料 ， 你 可 以 用 来 继续 vi 
学 习 之 旅 。 


e 学 习 vi 编辑 器 一 一 本 来 自 于 Wikipedia 的 Wikibook， 是 一 本 关于 vi 的 简要 指南 ， 并 介绍 了 几 个 类 似 vi 的 程序 ， 其 中 包 
括 vim。 它 可 以 在 以 下 链接 中 得 到 : 


http://en.wikibooks.org/Wwiki/Vi 
e。 The Vim Book 一 vim 项 目 ， 一 本 570 页 的 书籍 ， 包 含 了 (几乎) 所 有 的 vim 特性 。 你 能 在 下 面 链接 中 找到 它 : 
e Wikipedia 上 关于 Bill Joy 的 文章 ，vi 的 创始 人 。 

http://en.wikipedia.orgAwiki/Bill_Joy 
e Wikipedia 上 关于 Bram Moolenaar 的 文章 ，vim 的 作者 : 


http:/en.wikipedia.orgWwiki/Bram_Moolenaar 


自 定制 shell 提示 符 


在 这 一 章 中 ， 我 们 将 会 看 一 下 表面 上 看 来 很 琐碎 的 细节 一 Shell 提示 符 。 但 这 会 揭示 一 些 内 部 shell 和 终端 仿真 器 的 工作 方 
式 


oo 





和 Linux 内 的 许多 程序 一 样 ，shell 提示 符 是 可 高 度 配置 的 ， 虽 然 我 们 把 它 相 当 多 地 看 作 是 理所当然 的 ， 但 是 我 们 一 且 学 会 
了 怎样 控制 它 ，shell 提示 符 是 一 个 真正 有 用 的 设备 。 


解剖 一 个 提示 符 


我 们 默认 的 提示 符 看 起 来 像 这 样 : 


[me@linuxbox ~]$ 





包含 我 们 的 用 户 名 ， 主 机 名 和 当前 工作 目录 ， 但 是 它 又 是 怎样 得 到 这 些 东 西 的 呢 ? 结果 证 明 非 常 简单 。 提 示 符 是 由 一 
量 定义 的 ， 叫 做 PS1 (是 “prompt string one" 的 简写 ) 。 我 们 可 以 通过 echo 命令 来 查看 PS1 的 内 容 。 














[me@linuxbox ~]$ echo $PS1 
[\u@\h \W]\$ 


注意 : 如 果 你 shell 提示 符 的 内 容 和 上 例 不 是 一 模 一 样 ， 也 不 必 担 心 。 每 个 Linux 发 行 版 定义 的 提示 符 稍微 有 点 不 同 ， 其 中 
一 些 相当 异乎 寻常 。 


从 输出 结果 中 ， 我 们 看 到 那个 PS1 环境 变量 包含 一 些 这 样 的 字符 ， 比 方 说 中 括号 ，@ 符 号 ， 和 美元 符号 ， 但 是 剩余 部 分 就 
是 个 迷 。 我 们 中 一 些 机 敏 的 人 会 把 这 些 看 作 是 由 反 斜 杠 转 义 的 特殊 字符 ， 就 像 我 们 在 第 八 章 中 看 到 的 一 样 。 这 里 是 一 部 分 字 
符 列表 ， 在 提示 符 中 shell 会 特殊 对 待 这 些 字符 : 





表 14 一 1 : Shell 提示 符 中 用 到 的 转 义 字符 


序列 显示 值 
\a 以 ASCII 格式 编码 的 铃声 . 当 遇 到 这 个 转 义 序列 时 ， 计 算 机 会 发 出 喻 喻 的 响声 。 
\d 以 日 ， 月 ， 天 格式 来 表示 当前 日 期 。 例 如 ，“Mon May 26.” 
\h 本 地 机 的 主机 名 ， 但 不 带 末 尾 的 域名 。 
\H 完整 的 主机 名 。 
y 运行 在 当前 shell 会 话 中 的 工作 数 。 
Y 当前 终端 设备 名 。 
\n 一 个 换行 符 。 
Vr 一 个 回 车 符 。 
\s shell 程序 名 。 
vt 以 24 小 时 制 ，hours:minutes:seconds 的 格式 表示 当前 时 间 . 
NT 以 12 小 时 制 表 示 当 前 时 间 。 
\@ 以 12 小 时 制 ，AM/PM 格式 来 表示 当前 时 间 。 
\A 以 24 小 时 制 ，hours:minutes 格式 表示 当前 时 间 。 
Wu 当前 用 户 名 。 
Vv shell 程序 的 版 本 号 。 


WV Version and release numbers of the shell. 


Ww 当前 工作 目录 名 。 

Ww 当前 工作 目录 名 的 最 后 部 分 。 

! 当前 命 命 的 历史 号 。 

# 当前 shell 会 话 中 的 命令 数 。 

$ 这 会 显示 一 个 再 字符 ， 除 非 你 拥有 超级 用 户 权限 。 在 那 种 情况 下 ， 它 会 显示 一 个 #' 字符 。 


[ 标志 着 一 系列 一 个 或 多 个 非 打 印字 符 的 开始 。 这 被 用 来 嵌入 非 打印 的 控制 字符 ， 这 些 字符 以 某 
种 方式 来 操作 终端 仿真 器 ， 比 方 说 移动 光标 或 者 是 更 改 文 本 颜色 。 


] 标志 着 非 打印 字符 序列 结束 。 
试 试 一 些 可 替代 的 提示 符 设计 


参照 这 个 特殊 字符 列表 ， 我 们 可 以 更 改 提示 符 来 看 一 下 效果 。 首 先 ， 我 们 把 原来 提示 符 字 符 串 的 内 容 备份 一 下 ， 以 各 之 后 恢 
复原 貌 。 为 了 完成 备份 ， 我们 把 已 有 的 字符 串 复制 到 另 一 个 shell 变量 中 ， 这 个 变量 是 我 们 自己 创造 的 。 





[me@linuxbox ~]$ psl_old="$PS1" 


我 们 新 创建 了 一 个 叫做 ps1_old 的 变量 ， 并 把 变量 PS1 的 值 赋 ps1_old。 通 过 echo 命令 可 以 证 明 我 们 的 确 复制 了 PS1 的 
值 。 


[me@linuxbox ~]$ echo $psl_old 
[\u@\h \WI\$ 


在 终端 会 话 中 ， 我 们 能 在 任 一 时 间 复 原 提示 符 ， 只 要 简单 地 反 向 操作 就 可 以 了 。 


[me@linuxbox ~]$ PS1="$ps1_old" 


现在 ， 我 们 准备 开始 ， 让 我 们 看 看 如 果 有 一 个 空 的 字符 串 会 发 生 什 么 : 


[me@linuxbox ~]$ PS1= 


如 果 我 们 没有 给 提示 字符 串 赋 值 ， 那 么 我 们 什么 也 得 不 到 。 根 本 没有 提示 字符 串 ! 提示 符 仍然 在 那里 ， 但 是 什么 也 不 显示 ， 
正如 我 们 所 要 求 的 那样 。 我 们 将 用 一 个 最 小 的 提示 符 来 代替 它 : 


psl="\$" 





这 样 要 好 一 些 。 至 少 能 看 到 我 们 在 做 什么 。 注 意 双 引号 中 末尾 的 空格 。 当 提示 符 显 示 的 时 候 ， 这 个 空格 把 美元 符号 和 光标 分 
离开 。 


在 提示 符 中 添加 一 个 响 铃 : 


$ PS1="\a\$ " 


现在 每 次 提示 符 显示 的 时 候 ， 我 们 应 该 能 听 到 喻 喻 声 。 这 会 变 得 很 烦人 ， 但 是 它 可 能 会 很 有 用， 特别 是 当 一 个 需要 运行 很 长 
时 间 的 命令 执行 完 后 ， 我 们 要 得 到 通知 。 


下 一 步 ， 让 我 们 试 着 创建 一 个 信息 丰富 的 提示 符 ， 包 含 主机 名 和 当天 时 间 的 信息 。 


$ PS1="\A\h \$" 
17:33 linuxbox $ 


试 试 其 他 上 表 中 列 出 的 转 义 序列 ， 看 看 你 能 否 想 出 精彩 的 新 提示 符 。 


添加 颜色 


大 多 数 终端 仿真 器 程序 支持 一 定 的 非 打 印字 符 序列 来 控制 ， 比 方 说 字符 属性 〈 像 颜色 ， 黑 体 和 可 怕 的 闪烁 ) 和 光标 位 置 。 我 
们 会 更 深入 地 讨论 光标 位 置 ， 但 首先 我 们 要 看 一 下 字体 颜色 。 


混乱 的 终端 时 代 


回溯 到 终端 连接 到 远 端 计 算 机 的 时 代 ， 有 许多 竞争 的 终端 品牌 ， 它 们 各 自 工 作 不 同 。 它们 有 着 不 同 的 键盘 ， 以 不 同 的 
方式 来 解释 控制 信息 。Unix 和 类 似 于 Unix 的 系统 有 两 个 相当 复 末 的 子 系统 来 处 理 终端 控制 领域 的 混乱 局 面 〈 称 为 
termcap 和 terminfo) 。 如 果 你 查看 一 下 终端 仿真 器 最 底层 的 属性 设置 ， 可 能 会 找到 一 个 关于 终端 仿真 器 类 型 的 设 
置 。 
































为 了 努力 使 所 有 的 终端 都 讲 某 种 通用 语言 ， 美 国 国 家 标准 委员 会 (ANSI) 制定 了 一 套 标 准 的 字符 序列 集合 来 控制 视频 
终端 。 原 先 DOS 用 户 会 记得 ANSI.SYS 文件 ， 这 是 一 个 用 来 使 这 些 编码 解释 生效 的 文件 。 





























字符 颜色 是 由 发 送 到 终端 仿真 器 的 一 个 戏 入 到 了 要 显示 的 字符 流 中 的 ANSI 转 义 编码 来 控制 的 。 这 个 控制 编码 不 会 "打印 ?到 
屏幕 上 ， 而 是 被 终端 解释 为 一 个 指令 。 正 如 我 们 在 上 表 看 到 的 字符 序列 ， 这 个 [和 ] 序列 被 用 来 封装 这 些 非 打印 字符 。 一 个 
ANSI 转 义 编码 以 一 个 八进制 033 (这 个 编码 是 由 退出 按键 产生 的 ) 开头 ， 其 后 跟着 一 个 可 选 的 字符 属性 ， 在 之 后 是 一 个 指 
令 。 例 如 ， 把 文本 颜色 设 为 正常 (attribute = 0) ， 黑 色 文 本 的 编码 如 下 : 


\033[0;30m 





这 里 是 一 个 可 用 的 文本 颜色 列表 。 注 意 这 些 颜色 被 分 为 两 组 ， 由 应 用 程序 粗 体 字符 属性 〈1) 分 化 开 来 ， 这 个 属性 可 以 描绘 
出 “ 浅 " 色 文本 。 


表 14-2: 用 转 义 序列 来 设置 文本 颜色 


序列 文本 颜色 序列 文本 颜色 

\033[0;30m 黑色 \033[1;30m 深 灰色 
\033[0;31m 红色 \033[1;31m 浅 红 色 
\033[0;32m 绿色 \033[1;32m 浅 绿 色 
\033[0;33m 宗 色 \033[1;33m 黄色 

\033[0;34m 蓝 色 \033[1;34m 浅 蓝 色 
\033[0;35m 粉红 \033[1;35m 浅 粉 色 
\033[0;36m 青色 \033[1;36m 浅 青色 
\033[0;37m 浅 灰 色 \033[1;37m 白色 


让 我 们 试 着 制作 一 个 红色 提示 符 。 我 们 将 在 开头 加 入 转 义 编码 : 


<me@linuxbox ~>$ PS1=N\[\033[0;31m\]<\u@\h \W>\' 
<me@linuxbox ~>$ 


我 们 的 提示 符 生 效 了 ， 但 是 注意 我 们 在 提示 符 之 后 输入 的 文本 也 是 红色 的 。 为 了 修改 这 个 问题 ， 我 们 将 添加 另 一 个 转 义 编码 
到 这 个 提示 符 的 末尾 来 告诉 终端 仿真 器 恢复 到 原来 的 颜色 。 


<me@linuxbox ~>$ PS1=\[\033[0;31m\]<\u@\h \W>\$\[\033[Om\]' 
<me@linuxbox ~>$ 


这 看 起 来 要 好 些 ! 


也 有 可 能 要 设置 文本 的 背景 颜色 ， 使 用 下 面 列 出 的 转 义 编码 。 这 个 背景 颜色 不 支持 黑体 属性 。 


表 14-3: 用 转 义 序列 来 设置 背景 颜色 


\033[0;40m 蓝 色 \033[1;44m 黑色 

\033[0;41m 红色 \033[1;45m 粉红 

\033[0;42m 绿色 \033[1;46m 青色 

\033[0;43m 宗 色 \033[1;47m 浅 灰 色 
我 们 可 以 创建 一 个 带 有 红色 背景 的 提示 符 ， 只 是 对 第 一 个 转 义 编码 做 个 简单 的 修改 。 


<me@linuxbox ~>$ PS1=\[\033[0;41mM\]<\u@\h \W>\$\[\033[Om\] ' 
<me@linuxbox ~>$ 


试 试 这 些 颜 色 编 码 ， 看 看 你 能 定制 出 怎样 的 提示 符 


注意 : 除了 正常 的 (0) 和 黑体 (1) 字符 属性 之 外 ， 文 本 也 可 以 具有 下 划 线 (4)， 闪 烁 (5)， 和 反 向 (7) 属性 。 为 了 拥有 好 品味 
而 ， 许 多 终端 仿真 器 拒绝 使 用 这 个 闪烁 属性 。 





移动 光标 


lA di ee 
落 ， 显 示 一 个 时 钟 或 者 其 它 一 些 信 


些 编码 被 普通 地 用 来 ， 每 次 当 提 示 符 出 现 的 时 候 ， 会 在 屏幕 的 不 同位 置 比如 说 上 面 一 个 角 
息 。 这 里 是 一 系列 用 来 定位 光标 的 转 义 编码 : 


表 14 一 4 : 光标 移动 转 义 序列 


转 义 编码 行动 
\033[l;cH 把 光标 移 到 第 1 行 ， 第 c 列 。 
\033[nA 把 光标 向 上 移动 n 行 。 
\033[nB 把 光标 向 下 移动 n 行 。 
\033[nC 把 光标 向 前 移动 n 个 字符 。 
\033[nD 把 光标 向 后 移动 n 个 字符 。 
\033[2J 清空 屏幕 ， 把 光标 移 到 左上 角 (第 需 行 ， 第 需 列 ) 。 
\033[K 清空 从 光标 位 置 到 当前 行 末 的 内 容 。 
\033[s 存储 当前 光标 位 置 。 
\033[u 唤醒 之 前 存储 的 光标 位 置 。 


使 用 上 面 的 编码 ， 我 们 将 构建 一 个 提示 符 ， 每 次 当 这 个 提示 符 出 现 的 时 候 ， 会 在 屏幕 的 上 方 画 出 一 个 包含 时 钟 〈 由 黄色 文本 
泻 染 ) 的 红色 长 条 。 提 示 符 的 编码 就 是 这 个 看 起 来 伟人 敬 黑 的 字符 串 : 





PS1=\[\033[s\033[0;O0H\033[0;41m\033[K\033[1;33m\t\033[0m\033[u\] 
<\uU@\h W>\$ 


让 我 们 分 别 看 一 下 这 个 字符 串 的 每 一 部 分 所 表示 的 意思 : 


序列 行动 


[ 开始 一 个 非 打 印字 符 序 列 。 其 真正 的 目的 是 为 了 让 bash 能 够 正确 地 计算 提示 符 的 大 
小 。 如 果 没 有 这 个 转 义 字符 的 话 ， 命 合 行 编辑 功能 会 弄 错 光标 的 位 置 。 


存储 光标 位 置 。 这 个 用 来 使 光标 能 回 到 原来 提示 符 的 位 置 ， 当 长 条 和 时 钟 显示 到 屏幕 上 


3 方 之 后 。 当 心 一 些 终端 仿真 器 不 推崇 这 个 编码 。 

\033[0;0H 把 光标 移 到 屏幕 左上 角 ， 也 就 是 第 需 行 ， 第 零 列 的 位 置 。 

\033[0;41m 把 背景 设置 为 红色 。 
清空 从 当前 光标 位 置 到 行 末 的 内 容 。 因 为 现在 背景 颜色 是 红色 ， 则 被 清空 行 背 景 成 为 红 

\033[K SR 注意 虽然 一 直 清 空 到 行 末 ， 但 是 不 改变 光标 位 置 ， 它 仍然 在 屏幕 

\033[1;33m 把 文本 颜色 设 为 黄色 。 

vt 显示 当前 时 间 。 虽 然 这 是 一 个 可 "打印 "的 元 素 ， 但 我 们 仍 把 它 包含 在 提示 符 的 非 打 印 部 
分 ， 因为 我 们 不 想 bash 在 计算 可 见 提 示 符 的 真正 大 小 时 包括 这 个 时 钟 在 内 。 

\033[om 关闭 颜色 设置 。 这 对 文本 和 背景 都 起 作用 。 

\033[u 恢复 到 之 前 保存 过 的 光标 位 置 处 。 

] 结束 非 打 印字 符 序 列 。 

<u@\h \W>$ 提示 符 字符 串 。 

保存 提示 符 


显然 地 ， 我 们 不 想 总 是 敲 人 那个 怪物 ， 所 以 我 们 将 要 把 这 个 提示 符 存储 在 某 个 地 方 。 通 过 把 它 添加 到 我 们 的 .bashrc 文件 ， 
可 以 使 这 个 提示 符 永 久 存在 。 为 了 达到 目的 ， 把 下 面 这 两 行 添加 到 .bashrc 文件 中 。 





PS1=\[\033[s\033[0;OH\033[0;41m\033[K\033[1;33m\t\033[0m\033[u\]<\u@\h WW>\$ 
export PS1 


总 结 归 纳 
不 管 你 信 不 信 ， 还 有 许多 事情 可 以 由 提示 符 来 完成 ， 涉 及 到 我 们 在 这 里 没有 论 及 的 shell 函数 和 脚本 ， 但 这 是 一 个 好 的 开 


始 。 并 不 是 每 个 人 都 会 花心 思 来 更 改 提 示 符 ， 因 为 通常 默认 的 提示 符 就 很 让 人 满意 。 但 是 对 于 我 们 这 些 喜 欢 思考 的 人 们 来 
说 ，Shell 却 提供 了 许多 制造 琐碎 乐趣 的 机 会 。 


拓展 阅读 


e The Bash Prompt HOWTO 来 自 于 Linux 文档 工程 ， 对 shell 提示 符 的 用 途 进 行 了 相当 完备 的 论述 。 可 在 以 下 链接 中 得 
到 : 


http:/tldp.org/HOWTO/Bash-Prompt-HOWTO/ 
e。 Wikipedia 上 有 一 篇 关于 ANSI Escape Codes 的 好 文章 : 


http:/en.wikipedia.orgWwiki/ANSL_escape_code 


软件 包 人 管理 


如 果 我 们 花 些 时 间 在 Linux 社区 里 ， 我 们 会 得 知 很 多 针对 , 类 如 在 众多 Linux 发 行 版 中 哪个 是 最 好 的 (等 问题 的 ) 看 法 。 这 些 集 
中 在 像 这 些 事情 上 的 讨论 ， 比 方 说 最 漂亮 的 桌面 背景 (一 些 人 不 使 用 Ubuntu， 只 是 因为 Ubuntu 默认 主题 颜色 是 棕色 
的 ! ) 和 其 它 的 琐碎 东西 ， 经 常 变 得 非常 无 聊 。 


Linux 发 行 版 本 质量 最 重要 的 决定 因素 是 软件 包 管理 系 统 和 其 支持 社区 的 持久 性 。 随 着 我 们 花 更 多 的 时 间 在 Linux 上 ， 我 们 
会 发 现 它 的 软件 园地 是 非常 动态 的 。 软 件 不 断 变化 。 大 多 数 一 线 Linux 发 行 版 每 隔 六 个 月 发 布 一 个 新 版 本 ， 并 且 许 多 独立 的 
程序 每 天 都 会 更 新 。 为 了 能 和 这 些 如 暴风 雪 一 般 多 的 软件 保持 联系 ， 我 们 需要 一 些 好 工具 来 进行 软件 包 管理 。 





软件 包 管 理 是 指 系统 中 一 种 安装 和 维护 软件 的 方法 。 今 天 ， 通 过 从 Linux 发 行 版 中 安装 的 软件 包 ， 已 能 满足 许多 人 所 有 需要 
的 软件 。 这 不 同 于 早期 的 Linux， 人 们 需要 下 载 和 编辑 源码 来 安装 软件 。 编辑 源码 没有 任何 问题 ， 事 实 上 ， 拥 有 对 源码 的 访 
问 权限 是 Linux 的 伟大 奇迹 。 它 赋予 我 们 〈 其 它 每 个 人 ) 才干 来 检测 和 提高 系统 性 能 。 只 是 若 有 一 个 预先 编译 好 的 软件 包 处 
理 起 来 要 相对 容易 快速 些 。 这 章 中 ， 我 们 将 查看 一 些 用 于 包 管 理 的 命 舍 行 工具 。 虽 然 所 有 主流 Linux 发 行 版 都 提供 了 强大 且 
精致 的 图 形 管理 程序 来 维护 系统 ， 但 是 学 习 命令 行程 序 也 非常 重要 。 因 为 它们 可 以 完成 许多 让 图 形 化 管理 程序 处 理 起 来 困难 
(或 者 不 可 能 ) 的 任务 。 


打包 系统 


不 同 的 Linux 发 行 版 使 用 不 同 的 打包 系统 ， 一 般 而 言 ， 大 多 数 发 行 版 分 别 属于 两 大 包 管 理 技术 阵营 : Debian 的 ".deb"， 和 红 
帽 的 ".rpm"。 也 有 一 些 重要 的 例外 ， 上 比方 说 Gentoo， Slackware， 和 Foresight， 但 大 多 数 会 使 用 这 两 个 基本 系统 中 的 一 


个 
1 oo 


表 15-1: 主要 的 包 管理 系统 家 族 


包 管理 系统 发 行 版 (部 分 列表 ) 
Debian Style (.deb) Debian, Ubuntu, Xandros, Linspire 
Red Hat Style (.rpm) Fedora, CentOS, Red Hat Enterprise Linux, OpenSUSE, Mandriva, PCLinuxOS 


软件 包 管 理 系 统 是 怎样 工作 的 


在 专 有 软件 产业 中 找到 的 软件 发 布 方法 通常 需要 买 一 张 安 装 媒介 ， 比 方 说 "安装 盘 "， 然 后 运行 "安装 向 导 "， 来 在 系统 中 安装 新 
的 应 用 程序 。 





Linux 不 是 这 样 。Linux 系统 中 几乎 所 有 的 软件 都 可 以 在 互联 网 上 找到 。 其 中 大 多 数 软件 由 发 行商 以 包 文 件 的 形式 提供 ， 剩 
下 的 则 以 源码 形式 存在 ， 可 以 手动 安装 。 在 后 面 章节 里 ， 我 们 将 会 谈 谈 怎 样 通过 编译 源码 来 安装 软件 。 


包 文 件 


在 包 管理 系统 中 软件 的 基本 单元 是 包 文件 。 包 文件 是 一 个 构成 软件 包 的 文件 压缩 集合 。 一 个 软件 包 可 能 由 大 量程 序 以 及 支持 
这 些 程序 的 数据 文件 组 成 。 除 了 安装 文件 之 外 ， 软 件 包 文件 也 包括 关于 这 个 包 的 元 数据 ， 如 软件 包 及 其 内 容 的 文本 说 明 。 另 
外 ， 许 多 软件 包 还 包括 预 安装 和 安装 后 脚本 ， 这 些 脚本 用 来 在 软件 安装 之 前 和 之 后 执行 配置 任务 。 


软件 包 文 件 是 由 软件 包 维护 者 创建 的 ， 他 通常 是 〈 但 不 总 是 ) 一 名 软件 发 行商 的 屠 员 。 软 件 维护 者 从 上 游 提 供 商 (程序 作 
者 ) 那里 得 到 软件 源码 ， 然 后 编辑 源码 ， 创 建 软件 包 元 数据 以 及 所 需要 的 安装 脚本 。 通 常 ， 软 件 包 维护 者 要 把 所 做 的 修改 应 
用 到 最 初 的 源码 当中 ， 来 提高 此 软件 与 Linux 发 行 版 其 它 部 分 的 融合 性 。 


资源 库 


虽然 某 些 软件 项 目 选择 执行 他 们 自己 的 打包 和 发 布 策略 ， 但 是 现在 大 多 数 软件 包 是 由 发 行商 和 感 兴趣 的 第 三 方 创建 的 。 系 统 
发 行 版 的 用 户 可 以 在 一 个 中 心 资源 库 中 得 到 这 些 软件 包 ， 这 个 资源 库 可 能 包含 了 成 千 上 万 个 软件 包 ， 每 一 个 软件 包 都 是 专门 
为 这 个 系统 发 行 版 建立 和 维护 的 。 


因 软 件 开发 生命 周期 不 同 阶段 的 需要 ， 一 个 系统 发 行 版 可 能 维护 着 几 个 不 同 的 资源 库 。 例 如 ， 通 常会 有 一 个 "测试 "资源 库 ， 
其 中 包含 刚刚 建立 的 软件 包 ， 它 们 想 要 勇敢 的 用 户 来 使 用 ， 在 这 些 软件 包 正 式 发 布 之 前 ， 让 用 户 查找 错误 。 系 统 发 行 版 经 常 
会 有 一 个 "开发 "资源 库 ， 这 个 资源 库 中 保存 着 注定 要 包含 到 下 一 个 主要 版 本 中 的 半成品 软件 包 。 


ee 源 库 。 这 些 资源 库 需 要 支持 一 些 因 法 律 原因 ， 比如 说 专利 或 者 是 DRM 反 规 避 
问题 ， 而 不 能 被 包含 到 发 行 版 中 的 软件 。 可 能 最 著名 的 案例 就 是 那个 加 密 的 DVD 支持 ， 在 美国 这 是 不 合法 的 。 第 三 方 资源 
生效 的 国家 中 起 作用 。 这 些 资源 库 通常 完全 地 独立 于 它们 所 支持 的 资源 库 ， 要 想 使 用 它 

们 ， 你 必须 了 解 它 们 ， 手 动 地 把 它们 包含 到 软件 包 管 理 系统 的 配置 文件 中 。 





依赖 性 


程序 很 少 是 "孤立 的 "， 而 是 依赖 于 其 它 软 件 组 件 来 完成 它们 的 工作 。 常 见 活动 ， 以 输入 /输出 为 例 ， 就 是 由 共享 程序 例 程 来 处 
理 的 。 这 些 程序 例 程 存储 在 共享 库 中 ， 共 享 库 不 只 为 一 个 程序 提供 基本 服务 。 如 果 一 个 软件 包 需 要 共享 资源 ， 比 如 说 共享 
库 ， 据 说 就 有 一 个 依赖 。 现代 的 软件 包 管 理 系 统 都 提供 了 一 些 依赖 项 解析 方法 ， 以 此 来 确保 当 安 装 软 件 包 时 ， 也 安装 了 其 所 
有 的 依赖 程序 。 





层 和 底层 软件 包工 具 


软件 包 管理 系统 通常 由 两 种 工具 类 型 组 成 : 底层 工具 用 来 处 理 这 些 任务 ， 上 比方 说 安装 和 删除 软件 包 文件 ， 和 上 层 工具 ， 完 
元 数据 搜索 和 依赖 解析 。 在 这 一 章 中 ， 我 们 将 看 一 下 由 Debian 风格 的 系统 (比如 说 Ubuntu， 还 有 许多 其 它 系统 ) 提供 的 
工具 ， 还 有 那些 由 Red Hat 产品 使 用 的 工具 。 虽 然 所 有 基于 Red Hat 风格 的 发 行 版 都 依赖 于 相同 的 底层 程序 (rpm) ,但 是 
它们 却 使 用 不 同 的 上 层 工具 。 我 们 将 研究 上 层 程 序 yum 供 我 们 讨论 ，Fedora, Red Hat 企业 版 ， 和 CentOs 都 是 使 用 yum。 
其 它 基 于 Red Hat 风格 的 发 行 版 提供 了 带 有 可 比较 特性 的 上 层 工 具 。 


表 15-2: 包 管 理工 具 


发 行 版 底层 工具 上 层 工具 
Debian-Style dpkg apt-get, aptitude 
Fedora, Red Hat Enterprise Linux, CentOS rpm yum 


常见 软件 包 管理 任务 
通过 命 合 行 软件 包 管理 工具 可 以 完成 许多 操作 。 我 们 将 会 看 一 下 最 常用 的 工具 。 注 意 底 层 工具 也 支持 软件 包 文件 的 创建 ， 这 


个 话题 超出 了 本 书 叙 述 的 范围 。 在 以 下 的 讨论 中 ，"package_name" 这 个 术语 是 指 软件 包 实 际 名 称 ， 而 不 是 
指 "package_file"， 它 是 包含 在 软件 包 中 的 文件 名 。 


查找 资源 库 中 的 软件 包 
使 用 上 层 工具 来 搜索 资源 库 元 数据 ， 可 以 根据 软件 包 的 名 字 和 说 明 来 定位 它 


表 15-3: 软件 包 查 找 工具 


风格 命 命 
apt-get update 
Debian apt-cache search search_string 
Red Hat yum search search_string 


例如 : 搜索 一 个 yum 资源 库 来 查找 emacs 文本 编辑 器 ， 使 用 以 下 命令 : 


yum search emacs 


从 资源 库 中 安装 一 个 软件 包 
上 层 工具 允许 从 一 个 资源 库 中 下 载 一 个 软件 包 ， 并 经 过 完全 依赖 解析 来 安装 它 。 


表 15-4: 软件 包 安 装 命 兮 
风格 命 兮 


apt-get update 
Debian apt-get install package_name 


Red Hat yum install package_name 


例如 : 从 一 个 apt 资源 库 来 安装 emacs 文本 编辑 器 : 


apt-get update; apt-get install emacs 


通过 软件 包 文 件 来 安装 软件 
如 果 从 某 处 而 不 是 从 资源 库 中 下 载 了 一 个 软件 包 文件 ， 可 以 使 用 底层 工具 来 直接 (没有 经 过 依赖 解析 ) 安装 它 。 


表 15-5: 底层 软件 包 安装 命令 
风格 命 兮 


Debian dpkg --install package_flle 


Red Hat rpm -i package _file 


例如 : 如 果 已 经 从 一 个 并 非 资 源 库 的 网 站 下 载 了 软件 包 文件 emacs-22.1-7.fc7-i386.rpm， 则 可 以 通过 这 种 方法 来 安装 它 : 


rpm -i emacs-22.1-7.fc7-i386.rpm 


注意 : 因为 这 项 技术 使 用 底层 的 rpm 程序 来 执行 安装 任务 ， 所 以 没有 运行 依赖 解析 。 如 果 rpm 程序 发 现 缺 少 了 一 个 依赖 ， 
则 会 报错 并 退出 。 


卸载 软件 
可 以 使 用 上 层 或 者 底层 工具 来 卸载 软件 。 下 面 是 可 用 的 上 层 工具 。 


表 15-6: 软件 包 删 除 命令 
风格 命 兮 
Debian apt-get remove package_name 


Red Hat yum erase package_name 


例如 : 从 Debian 风格 的 系统 中 和 纯 载 emacs 软件 包 : 


apt-get remove emacs 


经 过 资源 库 来 更 新 软件 包 
最 常见 的 软件 包 管理 任务 是 保持 系统 中 的 软件 包 都 是 最 新 的 。 上 层 工具 仅 需 一 步 就 能 完成 这 个 至 关 重要 的 任务 。 


表 15-7: 软件 包 更 新 命 今 
风格 命 兮 
Debian apt-get update; apt-get upgrade 


Red Hat yum update 


例如 : 更 新 安装 在 Debian 风格 系统 中 的 软件 包 : 


apt-get update; apt-get upgrade 


经 过 软件 包 文 件 来 升级 软件 
如 果 已 经 从 一 个 非 资 源 库 网 站 下 载 了 一 个 软件 包 的 最 新 版 本 ， 可 以 安装 这 个 版 本 ， 用 它 来 替代 先前 的 版 本 : 


表 15-8: 底层 软件 包 升 级 命令 
风格 命 兮 


Debian dpkg --install package_flle 


Red Hat rpm -U package _file 


例如 : 把 Red Hat 系统 中 所 安装 的 emacs 的 版 本 更 新 到 软件 包 文 件 emacs-22.1-7.fc7-i386.rpmz 所 包含 的 emacs 版 本 。 


rpm -U emacs-22.1-7.fc7-i386.rpm 


注意 : dpkg 程序 与 安装 软件 相 比 没 有 一 个 特定 的 选项 ， 如 rpm 程序 那样 ， 来 升级 一 个 软件 包 ，。 


列 出 所 安装 的 软件 包 
下 表 中 的 命令 可 以 用 来 显示 安装 到 系统 中 的 所 有 软件 包 列表 : 


表 15-9: 列 出 所 安装 的 软件 包 命令 
风格 


录 
中 


Debian dpkg --list 


Red Hat rpm -qa 


确定 是 否 安 半 了 一 个 软件 包 
这 些 底 端 工具 可 以 用 来 显示 是 否 安装 了 一 个 指定 的 软件 包 : 


表 15-10: 软件 包 状态 命令 
风格 命 兮 
Debian dpkg --status package_name 


Red Hat rpm -q package_name 


例如 : 确定 是 否 Debian 风格 的 系统 中 安装 了 这 个 emacs 软件 包 : 


dpkg --status emacs 


显示 所 安装 软件 包 的 信息 
如 果 知道 了 所 安装 软件 包 的 名 字 ， 使 用 以 下 命令 可 以 显示 这 个 软件 包 的 说 明 信 息 : 


表 15-11: 查看 软件 包 信息 命令 
风格 命 兮 
Debian apt-cache show package_name 


Red Hat yum info package_name 


例如 : 查看 Debian 风格 的 系统 中 emacs 软件 包 的 说 明 信 息 : 


apt-cache show emacs 


查找 安装 了 某 个 文件 的 软件 包 
确定 哪个 软件 包 对 所 安装 的 某 个 特殊 文件 负责 ， 使 用 下 表 中 的 命 全 : 


表 15-12: 包 文件 识别 命令 
风格 命 全 
Debian dpkg --search file_name 


Red Hat rpm -qffile_name 


例如 : 在 Red Hat 系统 中 ， 查 看 哪个 软件 包 安 装 了 /usr/bin/vim 这 个 文件 


rpm -qf /usr/bin/vim 


总 结 归 纳 


在 随后 的 章节 里 面 ， 我 们 将 探讨 许多 不 同 的 程序 ， 这 些 程序 涵盖 了 广泛 的 应 用 程序 领域 。 虽 然 大 多 数 程序 一 般 是 默认 安装 
的 ， 但 是 若 所 需 程 序 没有 安装 在 系统 中 ， 那 么 我 们 可 能 需要 安装 额外 的 软件 包 。 通过 我 们 新 学 到 的 (和 了 解 的 ) 软件 包 管理 
知识 ， 我 们 应 该 没有 问题 来 安装 和 管理 所 需 的 程序 。 


Linux 软件 安装 谣言 


从 其 它 平台 迁移 过 来 的 用 户 有 时 会 成 为 谣言 的 受害 者 ， 说 是 在 Linux 系统 中 ， 安 装 软 件 有 些 困难 ， 并 且 不 同系 统 发 行 
版 所 使 用 的 各 种 各 样 的 打包 方案 是 一 个 障碍 。 唉 ， 它 是 一 个 障碍 ， 但 只 是 针对 于 那些 希望 把 他 们 的 秘密 软件 只 以 二 进 
制版 本 发 行 的 专 有 软件 供应 商 。 


Linux 软件 生态 系统 是 基于 开放 源 代码 理念 。 如 果 一 个 程序 开发 人 员 发 布 了 一 款 产 品 的 源码 ， 那 么 与 系统 发 行 版 相关 
联 的 开发 人 员 可 能 就 会 把 这 款 产品 打包 ， 并 把 它 包 含 在 他 们 的 资源 库 中 。 这 种 方法 保证 了 这 款 产品 能 很 好 地 与 系统 发 
行 版 整合 在 一 起 ， 同 时 为 用 户 “ 一 站 式 采购 "软件 提供 了 方便 ， 从 而 用 户 不 必 去 搜索 每 个 产品 的 网 站 。 





设备 驱动 差不多 也 以 同样 的 方式 来 处 理 ， 但 它们 不 是 系统 发 行 版 资源 库 中 单独 的 项 目 ， 它们 本 身 是 Linux 系统 内 核 的 
一 部 分 。 一 般 来 说 ， 在 Linux 当中 没有 一 个 类 似 于 "驱动 瘟 " 的 东西 。 要 不 内 核 支持 一 个 设备 ， 要 不 不 支持 ， 反 正 Linux 
内 核 支持 很 多 设备 ， 事 实 上 ， 多 于 Windows 所 支持 的 设备 数目 。 当 然 ， 如 果 你 需要 的 特定 设备 不 被 支持 ， 这 里 也 没有 
安慰。 当 那 种 情况 发 生 时 ， 你 需要 查找 一 下 原因 。 人 缺少 驱动 程序 支持 通常 是 由 以 下 三 种 情况 之 一 导致 : 





1. 设备 太 新 。 因为 许多 硬件 供应 商 没 有 积极 地 支持 Linux 的 发 展 ， 那 么 编写 内 核 驱动 代码 的 任务 就 由 一 些 Linux 社 
区 来 承担 ， 而 这 需要 花费 时 间 。 


2. 设备 太 奇异 。 不 是 所 有 的 发 行 版 都 包含 每 个 可 能 的 设备 驱动 。 每 个 发 行 版 会 建立 它们 自己 的 内 核 ， 因 为 内 核 是 可 
以 配置 的 (这 使 得 从 手表 到 主机 的 每 台 设 各 上 运行 Linux 成 为 可 能 ) ， 这 样 它们 可 能 会 忽略 某 个 特殊 设备 。 通 过 
定位 和 下 载 驱动 程序 的 源码 ， 可 能 需要 你 自己 (是 的 ， 由 你 ) 来 编译 和 安装 驱动 。 这 个 过 程 不 是 很 难 ， 而 是 参 
与 。 我 们 将 在 随后 的 章节 里 来 讨论 编译 软件 。 


3. 硬件 供应 商 隐 藏 信 息 。 他 们 既 不 发 布 应 用 于 Linux 系统 的 驱动 程序 代码 ， 也 不 发 布 技 术 文档 来 让 某 人 创建 它 。 这 
意味 着 硬件 供应 商 试图 保密 此 设备 的 程序 接口 。 因 为 我 们 不 想 在 计算 机 中 使 用 保密 的 设备 ， 所 以 我 建议 删除 这 命 
人 厌恶 的 软件 ， 把 它 和 其 它 无 用 的 项 目 都 仍 到 垃圾 桶 里 。 





拓展 阅读 


花 些 时 间 来 了 解 你 所 用 发 行 版 中 的 软件 包 管理 系统 。 每 个 发 行 版 都 提供 了 关于 自 带 软件 包 管理 工具 的 文档 。 另 外， 这 里 有 一 
些 更 普通 的 资源 : 


Debian GNU/Linux FAQ 关于 软件 包 管理 一 章 对 软件 包 管 理 进行 了 概述 : 
http:/www.debian.org/doc/FAQ/ch-pkgtools.en.html 

RPM 工程 的 主页 : 

http:/www.rpm.org 

杜 克 大 学 YUM 工程 的 主页 : 

http:Wlinux.duke.edu/projects/yumy/ 

了 解 一 点 儿 背 景 知 识 ，Wikipedia 上 有 一 篇 关于 metadata 的 文章 : 


http:/en.wikipedia.orgWiki/Metadata 


存储 媒介 


在 前 面 章节 中 ， 我 们 已 经 从 文件 级 别 看 了 操作 数据 。 在 这 章 里 ， 我 们 将 从 设备 级 别 来 考虑 数据 。 Linux 有 着 邻 人 惊奇 的 能 力 
来 处 理 存储 设备 ， 不 管 是 物理 设备 ， 上 比如 说 硬盘 ， 还 是 网 络 设备 ， 或 者 是 虚拟 存储 设备 ， 像 RAID (独立 磁盘 见 余 阵列 ) 和 
LVM (逻辑 省 管理 器 ) 。 


然而 ， 这 不 是 一 本 关于 系统 管理 的 书籍 ， 我 们 不 会 试图 深入 地 覆盖 整个 主题 。 我 们 将 努力 做 的 就 是 介绍 一 些 概念 和 用 来 管理 
存储 设 各 的 重要 命令 。 





我 们 将 会 使 用 USB 闪存 ，CD-RW 光盘 (因为 系统 配备 了 CD-ROM 烧 写 器 ) 和 一 张 软 盘 ( 若 系统 这 样 配备 ) ， 来 做 这 章 的 


练习 题 。 

我 们 将 看 看 以 下 命令 : 

e mount 一 挂 载 一 个 文件 系统 

e。 umount 一 卸载 一 个 文件 系统 

e。 fsck 一 检查 和 修复 一 个 文件 系统 

。 fdisk - 分 区 表 控制 器 

。 mkfs -- 创建 文件 系统 

e fdformat 一 格式 化 一 张 软盘 

e。 dd 一 把 面向 块 的 数据 直接 写 入 设备 

e genisoimage (mkisofs) - 创建 一 个 ISO 9660 的 映像 文件 
e Wodim (cdrecord) - 把 数据 写 入 光 存 储 媒介 

e。 md5sum 一 计算 MD5 检 验 码 

让 载 和 好 载 存 储 设 备 

Linux 桌面 系统 的 最 新 进展 已 经 使 存储 设备 管理 对 于 桌面 用 户 来 说 极其 容易 。 大 多 数 情况 下 ， 我 们 只 要 把 设备 连接 到 系统 


中 ， 它 就 能 工作 。 在 过 去 〈 比 如 说 ，2004 年 ) ， 这 个 工作 必须 手动 完成 。 在 非 桌面 系统 中 〈 例 如 ， 服 务 器 中 ) ， 这 仍然 是 一 
个 主要 地 手动 过 程 ， 因 为 服务 器 经 常 有 极端 的 存储 需求 和 复杂 的 配置 要 求 。 





管理 存储 设 各 的 第 一 步 是 把 设 各 连接 到 文件 系统 树 中 。 这 个 过 程 叫 做 挂 载 ， 人 允许 设备 参 与 到 操作 系统 中 。 回想 一 下 第 三 章 ， 
类 似 于 Unix 的 操作 系统 ， 像 Linux， 维 折 单 一 文件 系统 树 ， 设 备 连接 到 各 个 结 点 上 。 这 和 与 其 它 操作 系统 形成 对 照 ， 上 比如 说 
MS-DOS 和 Windows 系统 中 ， 每 个 设备 (例如 C\，D:' 等) 保持 着 单独 的 文件 系统 树 。 


有 一 个 叫做 /etc/fstab 的 文件 可 以 列 出 系统 启动 时 要 挂 裁 的 设备 (典型 地 ， 硬 盘 分 区 ) 。 下 面 是 来 自 于 Fedora 7 系统 
的 /etc/fstab 文件 实例 : 


LABEL=/12 / ext3 defaults Lo 
LABEL=/home /home ext3 defaults 1 2 
LABEL=/boot /boot ext3 defaults J 
tmpfs /devshm tmpfs defaults OO 
devpts /dev/pts devpts gid=5,mode=620 0 0 
sysfs /sys sysfs defaults 0 0 

proc /proc proc defaults OO 
LABEL=SWAP-sda3 /swap swap defaults Qnmo 





在 这 个 实例 中 所 列 出 的 大 多 数 文件 系统 是 虚拟 的 ， 并 不 适用 于 我 们 的 讨论 。 就 我 们 的 目的 而 言 ， 前 三 个 是 我 们 感 兴趣 的 : 


LABEL=/12 / ext3 defaults {eal 
LABEL=/home /home ext3 defaults 4 
LABEL=/boot /boot ext3 defaults 2 


这 些 是 硬盘 分 区 。 每 行 由 六 个 字段 组 成 ， 如 下 所 示 : 


表 16 一 1 : /etc/fstab 字段 
字段 内 容 说 明 


传统 上 ， 这 个 字段 包含 与 物理 设备 相关 联 的 设备 文件 的 实际 名 字 ， 比 如 说 /devwhda1 (第 一 
IDE 通道 上 第 一 个 主 设备 分 区 ) 。 然 而 今天 的 计算 机 ， 0 

引 设备 名 备 ) ， 许 多 现代 的 Linux 发 行 版 用 一 个 文本 标签 和 设备 相关 联 。 当 这 个 设备 连接 到 系统 中 时 ， 
这 个 标签 〈 当 储存 媒介 格式 化 时 ， 这 个 标签 会 被 添加 到 存储 媒介 中 ) 会 被 操作 系统 读 取 。 那样 
的 话 ， 不 管 赋 给 实际 物理 设备 哪个 设备 文件 ， 这 个 设备 仍然 能 被 系统 正确 地 识别 。 





2 挂 载 点 设备 所 连接 到 的 文件 系统 树 的 目录 。 
3 文件 系统 Linux 允许 挂 载 许多 文件 系统 类 型 。 大 多 数 本 地 的 Linux 文件 系统 是 ext3， 但 是 也 支持 很 多 其 
类 型 它 的， 比方 说 FAT16 (msdos), FAT32 (vfat)，NTFS (ntfs)，CD-ROM (iso9660)， 等 等 。 
4 选项 文件 系统 可 以 通过 各 种 各 样 的 选项 来 挂 载 。 有 可 能 ， 例 如 ， 挂 载 只 读 的 文件 系统 ， 或 者 挂 载 阻 
的 止 执行 任何 程序 的 文件 系统 (一 个 有 用 的 安全 特性 ， 避 人 免 删 除 媒介 。) 
5 频率 一 位 数字 ， 指 定 是 否 和 在 什么 时 间 用 dump 命令 来 备份 一 个 文件 系统 。 
6 次 序 一 位 数字 ， 指 定 fsck 命令 按照 什么 次 序 来 检查 文件 系统 。 


查看 挂 载 的 文件 系统 列表 


这 个 mount 命令 被 用 来 挂 载 文 件 系统 。 执 行 这 个 不 带 参数 的 命令 ， 将 会 显示 一 系列 当前 挂 载 的 文件 系统 : 


[me@linuxbox ~]$ mount 

/dev/sda2 on / type ext3 (rw) 

proc on /proc type proc (rw) 

sysfs on /sys type sysfs (rw) 

devpts on /dev/pts type devpts (rw,gid=5,mode=620) 
/dev/sda5 on /home type ext3 (rw) 

/dev/sdal on /boot type ext3 (rw) 

tmpfs on /dev/shm type tmpfs (rw) 

none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw) 
sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw) 

fusectl on /sys/fs/fuse/connections type fusectl (rw) 

/dev/sddl on /media/disk type vfat (rw,nosuid,nodev,noatime, 
uhelper=hal,uid=500,utf8,shortname=|ower) 
twin4:/musicbox on /misc/musicbox type nfs4 (rw,addr=192.168.1.4) 


这 个 列表 的 格式 是 : 设备 on 挂 载 点 type 文件 系统 类 型 (可 选 的 ) 。 例 如 ， 第 一 行 所 示 设 备 /dev/sda2 作为 根 文件 系统 被 挂 


载 ， 文 件 系 统 类 型 是 ext3， 并 且 可 读 可 写 (这 个 “rw" 选 项 ) 。 在 这 个 列表 的 底部 有 两 个 有 趣 的 条 





目 。 倒 数 第 二 行 显示 了 在 读 


卡 器 中 的 一 张 2G 的 SD 内 存 卡 ， 挂 载 到 了 /media/disk 上 。 最 后 一 行 是 一 个 网 络 设 各 ， 挂 载 到 了 /misc/musicbox 上 。 


第 一 次 实验 ， 我 们 将 使 用 一 张 CD-ROM。 首 先 ， 在 插入 CD-ROW 之 前 ， 我 们 将 看 一 下 系统 : 


[me@linuxbox ~]$ mount 
/dev/mapper/VolGroup00-LogVol00 on /type ext3 (rw) 
proc on /proc type proc (rw) 

sysfs on /sys type sysfs (rw) 

devpts on /dev/pts type devpts (rw,gid=5,mode=620) 
/dev/hdal on /boot type ext3 (rw) 

tmpfs on /dev/shm type tmpfs (rw) 

none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw) 
sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw) 





这 个 
这 个 系统 试图 自动 挂 载 插入 的 CD-ROM。 当 我 们 插入 光 胡 后 ， 我 们 看 看 下 面 的 输出 : 


列表 来 自 于 CentOS 5 系统 ， 使 用 LVM ( 逮 辑 卷 管理 器 ) 来 创建 它 的 根 文件 系统 。 正 如 许多 现在 的 Linux 发 行 版 一 样 ， 


[me@linuxbox ~]$ mount 
/dev/mapper/VolGroup00-LogVol00 on / type ext3 (rw) 
proc on /proc type proc (rw) 

sysfs on /sys type sysfs (rw) 

devpts on /dev/pts type devpts (rw,gid=5,mode=620) 
/dev/ihdal on /boot type ext3 (rw) 

tmpfs on /dev/shm type tmpfs (rw) 

none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw) 
sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw) 
/dev/ihdc on /media/live-1.0.10-8 type iso9660 (ro,noexec,nosuid, 
nodev,uid=500) 


当 我 们 插入 光盘 后 ， 除 了 领 外 的 一 行 之 外 ， 我 们 看 到 和 原来 一 样 的 列表 。 在 列表 的 末尾 ， 我 们 看 到 CD-ROW 已 经 挂 载 到 
了 /media/live-1.0.10-8 上 ， 它 的 文件 类 型 是 iso9660 (CD-ROW) 。 就 我 们 的 实验 目的 而 言 ， 我 们 对 这 个 设备 的 名 字 感 兴 
趣 。 当 你 自己 进行 这 个 实验 时 ， 这 个 设备 名 字 是 最 有 可 能 不 同 的 。 





警告 : 在 随后 的 实例 中 ， 至 关 重 要 的 是 你 要 密切 注意 用 在 你 系统 中 的 实际 设备 名 ， 并 且 不 要 使 用 此 文本 中 使 用 的 名 字 ! 
还 要 注意 音频 CD 和 CD-ROW 不 一 样 。 音 频 CD 不 包含 文件 系统 ， 这 样 在 通常 意义 上 ， 它 就 不 能 被 挂 载 了 。 


nd ei 并 把 它 重 新 挂 载 到 文件 系统 树 的 另 一 个 位 置 。 我 们 需要 超 
级 用 户 身份 (使 用 系统 相应 的 命令 ) 来 进行 操作 ， 并 且 用 umount〔 注 意 这 个 命 爸 的 拼写 ) 来 卸载 光盘 : 





[me@linuxbox ~]$ su - 
Password : 
[root@linuxbox ~]# umount /dewhdc 


下 一 步 是 创建 一 个 新 的 光盘 挂 载 点 。 简 单 地 说 ， 一 个 挂 载 点 就 是 文件 系统 树 中 的 一 个 目录 。 它 没有 什么 特殊 的 。 它 甚至 不 必 
是 一 个 空 目 录 ， 即 使 你 把 设备 挂 裁 到 了 一 个 非 空 目录 上 ， 你 也 不 能 看 到 这 个 目录 中 原来 的 内 容 ， 直 到 你 卸载 这 个 设备 。 就 我 
们 的 目的 而 言 ， 我 们 将 创建 一 个 新 目录 : 











[root@linuxbox ~]# mkdir /mnt/cdrom 

最 后 ， 我 们 把 这 个 CD-ROW 挂 载 到 一 个 新 的 挂 载 点 上 。 这 个 -t 选 项 用 来 指定 文件 系统 类 型 : 
[root@linuxbox ~]# mount -tiso9660 /dev/hdc /mnt/cdrom 
后 ， 我 们 可 以 通过 这 个 新 挂 载 点 来 查看 CD-ROW 的 内 容 : 


[root@linuxbox ~]# cd /mnt/cdrom 
[root@linuxbox cdrom]# 1s 


注意 当 我 们 试图 卸载 这 个 CD-ROW 时 ， 发 生 了 什么 事情 。 


[root@linuxbox cdrom]# umount /dev/hdc 
umount: /mnt/cdrom: device is busy 


这 是 怎么 回 事 呢 ? 原因 是 我 们 不 能 伯 载 一 个 设备 ， 如 果 某 个 用 户 或 进程 正在 使 用 这 个 设备 的 话 。 在 这 种 情况 下 ， 我 们 把 工作 
目录 更 改 到 了 CD-ROW 的 挂 裁 点 ， 这 个 挂 载 点 导致 设备 忙 太 。 我 们 可 以 很 容易 地 修复 这 个 问题 通过 把 工作 目录 改 到 其 它 
录 而 不 是 这 个 挂 载 点 。 


[root@linuxbox cdrom]# cd 
[root@linuxbox ~]# umount /dev/hdc 


现在 这 个 设备 成 功 卸 载 了 。 


为 什么 和 卸载 重要 





如 果 你 看 一 下 free 命令 的 输出 结果 ， 这 个 命令 用 来 显示 关于 内 存 使 用 情况 的 统计 信息 ， 你 会 看 到 一 个 统计 值 叫 

做 "buffers“。 计 算 机 系统 绅 在 尽 可 能 快 地 运行 。 系 统 运行 速度 的 一 个 阻碍 是 缓慢 的 设备 。 打 印 机 是 一 个 很 好 的 例子 。 

即使 最 快速 的 打印 机 相 比 于 计算 机 标准 也 极其 地 缓慢 。 一 台 计 算 机 确实 会 运行 地 非常 慢 ， 如 果 它 要 停 下 来 等 待 一 台 打 
印 机 打印 完 一 页 。 在 早期 的 个 人 电脑 时 代 〈 多 任务 之 前 ) ， 这 真是 个 问题 。 如 果 你 正在 编辑 电子 表格 或 者 是 文本 文 
档 ， 每 次 你 要 打印 文件 时 ， 计 算 机 都 会 停 下 来 而 且 变 得 不 能 使 用 。 计算 机 能 以 打印 机 可 接受 的 最 快速 度 把 数据 发 送 给 
打印 机 ， 但 由 于 打印 机 不 能 快速 地 打印 ， 这 个 发 送 速度 会 非常 慢 。 这 个 问题 被 解决 了 ， 由 于 打印 机 缓存 的 出 现 ， 一 个 
包含 一 些 RAM 内 存 的 设备 ， 位 于 计算 机 和 打印 机 之 间 。 通 过 打印 机 缓存 ， 计 算 机 把 要 打印 的 结果 发 送 到 这 个 缓存 

区 ， 数据 会 迅速 地 存储 到 这 个 RAM 中 ， 这 样 计 算 机 就 能 回去 工作 ， 而 不 用 等 待 。 与 此 同时 ， 打 印 机 缓存 将 会 以 打印 
机 可 接受 的 速度 把 缓存 中 的 数据 缓慢 地 输出 给 打印 机 。 





























缓存 被 广泛 地 应 用 于 计算 机 中 ， 使 其 运行 地 更 快 。 别 让 偶尔 地 需要 读 取 或 写 人 慢 设备 阻碍 了 系统 的 运行 速度 。 在 实际 
与 慢 设备 交互 之 前 ， 操 作 系 统 会 尽 可 能 多 的 读 取 或 写 和 人 数据 到 内 存 中 的 存储 设备 里 。 以 Linux 操作 系统 为 例 ， 你 会 注 
意 到 系统 看 似 填充 了 多 于 它 所 需要 的 内 存 。 这 不 意味 着 Linux 正在 使 用 所 有 的 内 存 ， 它 意味 着 Linux 正在 利用 所 有 可 
用 的 内 存 ， 来 作为 缓存 区 。 

















这 个 缓存 区 允许 非常 快速 地 写 入 存储 设备 ， 因 为 写 和 物理 设 备 的 操作 被 延迟 到 后 面 进行 。 同 时 ， 这 些 注定 要 传送 到 设 
备 中 的 数据 正在 内 存 中 堆积 起 来 。 时 不 时 地 ， 操 作 系 统 会 把 这 些 数据 写 入 物理 设备 。 














印 载 一 个 设备 需要 把 所 有 剩余 的 数据 写 入 这 个 设备 ， 所 以 设备 可 以 被 安全 地 移 除 。 如 果 没有 伯 载 设备 ， 就 移 除了 它 
就 有 可 能 没有 把 注定 要 发 送 到 设备 中 的 数据 输送 完毕 。 在 某 些 情况 下 ， 这 些 数据 可 能 包含 重要 的 目录 更 新 信息 ， 这 将 
导致 文件 系统 损坏 ， 这 是 发 生 在 计算 机 中 的 最 坏 的 事情 之 一 




















确定 设备 名 称 


有 时 很 难 来 确定 设备 名 称 。 在 以 前 ， 这 并 不 是 很 难 。 一 台 设 备 总 是 在 某 个 固定 的 位 置 ， 也 不 会 挪动 它 。 类 似 于 Unix 的 系统 
喜欢 设备 那样 安排 。 之 前 在 开发 Unix 系统 的 时 候 , “更 改 一 个 磁 瘟 驱动 器 "要 用 一 辆 又 车 从 机 房 中 移 除 一 台 如 洗衣 机 大 小 的 设 
备 。 最 近 几 年 ， 典 型 的 桌面 硬件 配置 已 经 变 得 相当 动态 ， 并 且 Linux 已 经 发 展 地 比 其 祖先 更 加 灵活 。 在 以 上 事例 中 ， 我 们 利 
用 现代 Linux 桌面 系统 的 功能 来 “自动 地 " 挂 载 设备 ， 然 后 再 确定 设备 名 称 。 但 是 如 果 我 们 正在 管理 一 台 服 务 器 或 者 是 其 它 一 
些 〈 这 种 自动 挂 载 功 能 ) 不 会 发 生 的 环境 ， 我 们 又 如 何 能 查 清 设 备 名 呢 ? 


首先 ， 让 我 们 看 一 下 系统 怎样 来 命名 设备 。 如 果 我 们 列 出 目录 /dev (所 有 设备 的 住所 ) 的 内 容 ， 我 们 会 看 到 许 许 多 多 的 设 
备 : 


[me@linuxbox ~]$ ls /dev 


这 个 列表 的 内 容 揭示 了 一 些 设备 命名 的 模式 。 这 里 有 几 个 : 


表 16 一 2 : Linux 存储 设 各 名 称 
模式 设备 
/dev/fd 软盘 驱动 器 


老 系统 中 的 IDE(PATA) 磁 盘 。 典 型 的 主板 包含 两 个 IDE 连接 器 或 者 是 通道 ， 每 个 连接 器 带 有 一 根 绕 

线 ， 每 根 线 线 上 有 两 个 硬盘 驱动 器 连接 点 。 绕 线 上 的 第 一 个 驱动 器 叫做 主 设备 ， 第 二 个 叫做 从 设 
/dev/ihd 备 。 设 备 名 称 这 样 安排 ，/dev/hdb 是 指 第 一 通道 上 的 主 设 各 名 ; /dev/hdb 是 第 一 通道 上 的 从 设备 

名 ; /dev/hdc 是 第 二 通道 上 的 主 设备 名 ， 等 等 。 末 尾 的 数字 表示 硬盘 驱动 器 上 的 分 区 。 例 

如 ，/dewhda1 是 指 系统 中 第 一 硬盘 驱动 器 上 的 第 一 个 分 区 ， 而 /dev/hda 则 是 指 整个 硬盘 驱动 器 。 


/dev/Ip 打印 机 
SCSI 磁盘 。 在 最 近 的 Linux 系统 中 ， 内 核 把 所 有 类 似 于 磁盘 的 设备 (包括 PATA/SATA 硬盘 ， 闪 
/dev/sd 存 ， 和 USB 存储 设备 ， 比 如 说 可 移动 的 音乐 播放 器 和 数码 相机 ) 看 作 SCSI 磁盘 。 剩 下 的 命名 系统 


类 似 于 上 述 所 描述 的 旧 的 /devhd 命 名 方案 。 
/dev/sr 光盘 (CD/DVD 读 取 器 和 烧 写 器 ) 


另外 ， 我 们 经 常 看 到 符号 链接 比如 说 /devcdrom，/dev/dvd 和 /dev/floppy， 它 们 指向 实际 的 设备 文件 ， 提 供 这 些 链接 是 为 了 
方便 使 用 。 如 果 你 工作 的 系统 不 能 自动 挂 载 可 移动 的 设备 ， 你 可 以 使 用 下 面 的 技巧 来 决定 当 可 移动 设备 连接 后 ， 它 是 怎样 被 
命名 的 。 首 先 ， 启 动 一 个 实时 查看 文件 /var/log/messages (你 可 能 需要 超级 用 户 权 限 ) 


[me@linuxbox ~]$ sudo tail -f /var/log/messages 





这 个 文件 的 最 后 几 行 会 被 显示 ， 然 后 停止 。 下 一 步 ， 插 入 这 个 可 移动 的 设备 。 在 这 个 例子 里 ， 我 们 将 使 用 一 个 16MB 闪存 。 
瞬间 ， 内 核 就 会 发 现 这 个 设备 ， 并 且 探 测 它 : 


Jul 23 10:07:53 linuxbox kernel: usb 3-2: new full speed USB device 
using uhci_hcd and address 2 

Jul 23 10:07:53 linuxbox kernel: usb 3-2: configuration #1 chosen 
from 1 choice 

Jul 23 10:07:53 linuxbox kernel: scsi3 : SCS|I emulation for USB Mass 
Storage devices 

Jul 23 10:07:58 linuxbox kernel: scsi scan: INQUIRY result too short 
(5), using 36 

Jul 23 10:07:58 linuxbox kernel: scsi 3:0:0:0: Direct-Access Easy 
Disk 1.00 PQ: 0 ANSI: 2 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] 31263 512-byte 
hardware sectors (16 MB) 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Write Protect is 
off 
Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Assuming drive 
cache: write through 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] 31263 512-byte 
hardware sectors (16 MB) 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Write Protect is 
off 
Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Assuming drive 
cache: write through 

Jul 23 10:07:59 linuxbox kernel: sdb: sdb1 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Attached SCSI 
removable disk 

Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: Attached scsi generic 
sg3 type 0 








显示 再 次 停止 之 后 ， 输 入 Ctrl-c， 重 新 得 到 提示 符 。 输 出 结果 的 有 趣 部 分 是 一 再 提 及 “[sdb]"， 这 正好 符 和 我 们 期 望 的 SCSI 磁 
盘 设备 名 称 。 知 道 这 一 点 后 ， 有 两 行 输出 变 得 颇具 启发 性 : 





Jul 23 10:07:59 linuxbox kernel: sdb: sdb1 
Jul 23 10:07:59 linuxbox kernel: sd 3:0:0:0: [sdb] Attached SCSI 
removable disk 


这 告诉 我 们 这 个 设 各 名 称 是 /dev/sdb 指 整个 设备 ，/dev/sdb1 是 这 个 设备 的 第 一 分 区 。 正如 我 们 所 看 到 的 ， 使 用 Linux 系统 
充满 了 有 趣 的 监测 工作 。 


小 贴 士 : 使 用 这 个 tail -fNarlog/messages 技巧 是 一 个 很 不 错 的 方法 ， 可 以 实时 观察 系统 的 一 举 一 动 。 


既然 知道 了 设备 名 称 ， 我 们 就 可 以 挂 载 这 个 闪存 驱动 器 了 : 


[me@linuxbox ~]$ sudo mkdir /mnt/flash 

[me@linuxbox ~]$ sudo mount /dev/sdb1 /mnt/flash 
[me@linuxbox ~]$ df 

Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/sda2 LS5LLE5452 D51806944009775164935%Y/ 
/dev/sda5 59631908 31777376 24776480 57% /home 
/dev/sdal 147764 2 122858 13% /boot 

tmpfs 776808 0 776808 0% /devshm 
/dev/sdb1 15560 0 15560 0% /mnt/flash 


这 个 设备 名 称 会 保持 不 变 只 要 设 各 与 计算 机 保持 连接 并 且 计 算 机 不 会 重新 启动 。 


创建 新 的 文件 系统 


假若 我 们 想 要 用 Linux 本 地 文件 系统 来 重新 格式 化 这 个 闪存 驱动 器 ， 而 不 是 它 现 用 的 FAT32 系 统 。 这 涉及 到 两 个 步骤 : 1. 
(可 选 的 ) 创建 一 个 新 的 分 区 布局 若 已 存在 的 分 区 不 是 我 们 喜欢 的 。2. 在 这 个 闪存 上 创建 一 个 新 的 空 的 文件 系统 。 


注意 ! 在 下 面 的 练习 中 ， 我 们 将 要 格式 化 一 个 闪存 驱动 器 。 拿 一 个 不 包含 有 用 数据 的 驱动 器 作为 实验 品 ， 因 为 它 将 会 被 擦 
除 ! 再 次 ， 请 确定 你 指定 了 正确 的 系统 设备 名 称 。 未 能 注意 此 警告 可 能 导致 你 格式 化 ( 即 擦 除 ) 错误 的 驱动 器 ! 





用 fdisk 命令 操作 分 区 


这 个 fdisk 程序 允许 我 们 直接 在 底层 与 类 似 磁盘 的 设备 〈 比 如 说 硬盘 驱动 器 和 闪存 驱动 器 ) 进行 交互 。 使 用 这 个 工具 可 以 在 
设备 上 编辑 ， 删 除 ， 和 创建 分 区 。 以 我 们 的 闪存 驱动 器 为 例 ， 首先 我 们 必须 卸载 它 (如 果 需 要 的 话 ) ， 然 后 调用 fdisk 程 
序 ， 如 下 所 示 : 


[me@linuxbox ~]$ sudo umount /devsdb1 
[me@linuxbox ~]$ sudo fdisk /dev/sdb 


注意 我 们 必须 指定 设备 名 称 ， 就 整个 设备 而 言 ， 而 不 是 通过 分 区 号 。 这 个 程序 启动 后 ， 我 们 将 看 到 以 下 提示 : 
command (m for help): 
输入 "m" 会 显示 程序 菜单 : 


Command action 
a toggle a bootable flag 


我 们 想 要 做 的 第 一 件 事情 是 检查 已 存在 的 分 区 布局 。 输 入 "p" 会 打印 出 这 个 设备 的 分 区 表 : 


Command (m for help): p 


Disk /dev/sdb: 16 MB, 16006656 bytes 
1 heads, 31 sectors/track, 1008 cylinders 
Units = cylinders of 31 * 512 = 15872 bytes 


Device Boot Start End Blocks 1d System 
/dev/sdb1 2 1008 15608Tb w95 FAT32 


在 此 例 中 ， 我 们 看 到 一 个 16MB 的 设备 只 有 一 个 分 区 (1)， 此 分 区 占用 了 可 用 的 1008 个 柱 面 中 的 1006 个 , 并 被 标识 为 
Windows 95 FAT32 分 区 。 有 些 程 序 会 使 用 这 个 标志 符 来 限制 一 些 可 以 对 磁盘 所 做 的 操作 ， 但 大 多 数 情况 下 更 改 这 个 标志 符 
没有 危害 。 然 而 ， 为 了 叙述 方便 ， 我 们 将 会 更 改 它 ， 以 此 来 表明 是 个 Linux 分 区 。 在 更 改 之 前 ， 首 先 我 们 必须 找到 被 用 来 识 
别 一 个 Linux 分 区 的 ID 号 码 。 在 上 面 列表 中 ， 我 们 看 到 ID 号 码 “b" 被 用 来 指定 这 个 已 存在 的 分 区 。 要 查看 可 用 的 分 区 类 型 列 
表 ， 参考 之 前 的 程序 菜单 。 我 们 会 看 到 以 下 选项 : 


| list known partition types 


如 果 我 们 在 提示 符 下 输入 “"， 就 会 显示 一 个 很 长 的 可 能 类 型 列表 。 在 它们 之 中 会 看 到 “b” 为 已 存在 分 区 类 型 的 ID 号 ， 
而 83" 是 针对 Linux 系统 的 ID 号 。 


回 到 之 前 的 菜单 ， 看 到 这 个 选项 来 更 改 分 区 ID 号 : 


t change a partition's system id 


我 们 先 输入 尼 ， 再 输入 新 的 ID 号 : 


Command (m for help):t 

Selected partition 1 

Hex code (type Lto list codes): 83 

Changed system type of partition 1 to 83 (Linux) 





这 就 完成 了 我 们 需要 做 得 所 有 修改 。 到 目前 为 止 ， 还 没有 接触 这 个 设备 〈 所 有 修改 都 存储 在 内 存 中 ， 而 不 是 在 此 物理 设备 
中 ) ， 所 以 我 们 将 会 把 修改 过 的 分 区 表 写 入 此 设备 ， 再 退出 。 为 此 ， 我 们 输入 在 提示 符 下 输入 "Ww" 


Command (m for help): w 

The partition table has been altered! 

Calling ioctl() to re-read partition table. 

WARNING: Ifyou have created or modified any DOS 6.x 
partitions, please see the fdisk manual page for additional 
information. 

Syncing disks. 

[me@linuxbox ~]$ 


如 果 我 们 已 经 决定 保持 设备 不 变 ， 可 在 提示 符 下 输入 "q"， 这 将 退出 程序 而 没有 写 更 改 。 我 们 可 以 安全 地 忽略 这 些 不 祥 的 警告 


信息 。 


用 mkfs 命令 创建 一 个 新 的 文件 系统 


完成 了 分 区 编辑 工作 ( 它 或 许 是 轻 量 级 的 ) ， 是 时 候 在 我 们 的 闪存 驱动 器 上 创建 一 个 新 的 文件 系统 了 。 为 此 ， 我 们 会 使 用 
mkfs ("make file system" 的 简写 ) ， 它 能 创建 各 种 格式 的 文件 系统 。 在 此 设备 上 创建 一 个 ext3 文 件 系 统 ， 我 们 使 用 "-t" 选项 
来 指定 这 个 "ext3" 系 统 类 型 ， 随 后 是 我 们 要 格式 化 的 设备 分 区 名 称 : 


[me@linuxbox ~]$ sudo mkfs -t ext3 /dev/sdb1 

mke2fs 1.40.2 (12-Jul-2007) 

Filesystem label= 

OS type: Linux 

Block size=1024 (log=0) 

Fragment size=1024 (log=0) 

3904 inodes, 15608 blocks 

780 blocks (5.00%) reserved for the super user 

First data block=1 

Maximum filesystem blocks=15990784 

2 block groups 

8192 blocks per group, 8192 fragments per group 

1952 inodes per group 

Superblock backups stored on blocks: 

8193 

Writing inode tables: done 

Creating journal (1024 blocks): done 

Writing superblocks and filesystem accounting information: done 
This filesystem will be automatically checked every 34 mounts or 
180 days, whichever comes first. Use tune2fs -c or -i to override. 
[me@linuxbox ~]$ 


当 ext3 被 选 为 文件 系统 类 型 时 ， 这 个 程序 会 显示 许多 信息 。 若 把 这 个 设备 重新 格式 化 为 它 最 初 的 FAT32 文 件 系统 ， 指 
定 "vfat" 作 为 文件 系统 类 型 : 


[me@linuxbox ~]$ sudo mkfs -t vfat /dev/sdb1 


任何 时 候 添 加 额外 的 存储 设备 到 系统 中 时 ， 都 可 以 使 用 这 个 分 区 和 格式 化 的 过 程 。 虽 然 我 们 只 以 一 个 小 小 的 闪存 驱动 器 为 
例 ， 同 样 的 操作 可 以 被 应 用 到 内 部 硬盘 和 其 它 可 移动 的 存储 设备 上 像 USB 硬 衣 驱动 器 。 





测试 和 修复 文件 系统 


在 之 前 讨论 文件 /etc/fstab 时 ， 我 们 会 在 每 行 的 末尾 看 到 一 些 神秘 的 数字 。 每 次 系统 启动 时 ， 在 挂 载 系统 之 前 ， 都 会 按照 惯例 


检查 文件 系统 的 完整 性 。 这 个 任务 由 fsck 程序 (是 "file system check" 的 简写 ) 完成 。 每 个 fstab 项 中 的 最 后 一 个 数字 指定 了 
设备 的 检查 顺序 。 在 上 面 的 实例 中 ， 我 们 看 到 首先 检查 根 文件 系统 ， 然 后 是 home 和 boot 文件 系统 。 若 最 后 一 个 数字 是 需 
则 相应 设备 不 会 被 检查 。 


除了 检查 文件 系统 的 完整 性 之 外 ，fsck 还 能 修复 受 损 的 文件 系统 ， 其 成 功 度 依赖 于 损坏 的 数量 。 在 类 似 于 Unix 的 文件 系统 
中 ， 文 件 恢复 的 部 分 被 放置 于 losttfound 目录 里 面 ， 位 于 每 个 文件 系统 的 根 目录 下 面 。 


检查 我 们 的 闪存 驱动 器 (首先 应 该 卸载 ) ， 我 们 能 执行 下 面 的 操作 : 


[me@linuxbox ~]$ sudo fsck /dev/sdb1l 

fsck 1.40.8 (13-Mar-2008) 

e2fsck 1.40.8 (13-Mar-2008) 

/dev/sdb1: clean, 11/3904 files, 1661/15608 blocks 


以 我 的 经 验 ， 文 件 系 统 损 坏 情况 相当 罕见 ， 除 非 硬件 存在 问题 ， 如 磁盘 驱动 器 故障 。 在 大 多 数 系统 中 ， 系 统 启动 阶段 若 探 测 
到 文件 系统 已 经 损坏 了 ， 则 会 导致 系统 停止 下 来 ， 在 系统 继续 执行 之 前 ， 会 指导 你 运行 fsck 程序 。 


什么 是 fsck? 











在 Unix 文化 中 ，"fsck" 这 个 单词 往往 会 被 用 来 代替 一 个 流行 的 词 ，“fsck" 和 这 个 词 共享 了 三 个 字母 。 这 个 尤其 适用 ， 因 
为 你 可 能 会 说 出 上 文 提 到 的 词 ， 若 你 发 现 自己 处 于 这 种 境况 下 ， 被 强制 来 运行 fsck 命令 时 。 {: .single} 














格式 化 软 意 
对 于 那些 还 在 使 用 配备 了 软盘 驱动 器 的 计算 机 的 用 户 ， 我 们 也 能 管理 这 些 设备 。 准 各 一 张 可 用 的 空白 软盘 要 分 两 个 步骤 。 首 
先 ， 对 这 张 软盘 执行 低级 格式 化 ， 然 后 创建 一 个 文件 系统 。 为 了 完成 格式 化 ， 我 们 使 用 fdformat 程序 ， 同 时 指定 软盘 设备 名 


称 (通常 为 /dev/fd0) 


[me@linuxbox ~]$ sudo fdformat /dev/fd0 

Double-sided, 80 tracks, 18 sec/track. Total capacity 1440 kB. 
Formatting ... done 

Verifying ... done 


接 下 来 ， 通 过 mkfs 命令 ， 给 这 个 软盘 创建 一 个 FAT 文件 系统 : 


[me@linuxbox ~]$ sudo mkfs -t msdos /dev/fd0 


注意 我 们 使 用 这 个 “msdos" 文 件 系统 类 型 来 得 到 旧 (小 的 ) 风格 的 文件 分 配 表 。 当 一 个 软磁盘 被 准备 好 之 后 ， 则 可 能 像 其 它 
设备 一 样 挂 载 它 。 





直接 把 数据 移入 /出 设备 


虽然 我 们 通常 认为 计算 机 中 的 数据 以 文件 形式 来 组 织 数 据 ， 也 可 以 “原始 的 "形式 来 考虑 数据 。 如 果 我 们 看 一 下 磁盘 驱动 器 ， 
例如 ， 我 们 看 到 它 由 大 量 的 数据 “ 块 "组 成 ， 而 操作 系统 却 把 这 些 数据 块 看 作 目 录 和 文件 。 然 而 ， 如 果 把 磁盘 驱动 器 简单 地 看 
成 一 个 数据 块 大 集合 ， 我 们 就 能 执行 有 用 的 任务 ， 如 克隆 设备 。 


这 个 dd 程序 能 执行 此 任务 。 它 可 以 把 数据 块 从 一 个 地 方 复制 到 另 一 个 地 方 。 它 使 用 独特 的 语法 〈 由 于 历史 原因 ) ， 经 常 它 
被 这 样 使 用 : 


dd if=input file of=output file [bs=block _ size [count=blocks]] 


比方 说 我 们 有 两 个 相同 容量 的 USB 闪存 驱动 器 ， 并 且 要 精确 地 把 第 一 个 驱动 器 (中 的 内 容 ) 复制 给 第 二 个 。 如 果 连 接 两 个 
设备 到 计算 机 上 ， 它 们 各 自 被 分 配 到 设备 /dev/sdb 和 /dev/sdc 上 ， 这 样 我 们 就 能 通过 下 面 的 命令 把 第 一 个 驱动 器 中 的 所 有 数 
据 复 制 到 第 二 个 驱动 器 中 。 


dd if=/dev/sdb of=/dev/sdc 


或 者 ， 如 果 只 有 第 一 个 驱动 器 被 连接 到 计算 机 上 ， 我 们 可 以 把 它 的 内 容 复 制 到 一 个 普通 文件 中 供 以 后 恢复 或 复制 数据 : 


dd if=/dev/sdb of=flash_drive.img 


警告 ! 这 个 dd 命令 非常 强大 。 虽 然 它 的 名 字 来 自 于 "数据 定义 "”， 有 时 候 也 把 它 叫 做 "清除 磁 旭 ” 因为 用 户 经 常会 误 输入 if 或 of 
的 规范 。 在 按 下 回 车 键 之 前 ， 要 再 三 检查 输入 与 输出 规范 ! 


创建 CD-ROM 映像 


写 入 一 个 可 记录 的 CD-ROM (一 个 CD-R 或 者 是 CD-RW) 由 两 步 组 成 ; 首先 ， 构 建 一 个 iso 映像 文件 ， 这 就 是 一 个 CD- 
ROM 的 文件 系统 映像 ， 第 二 步 ， 把 这 个 映像 文件 写 入 到 CD-ROM 媒介 中 。 


创建 一 个 CD-ROM 的 映像 拷贝 


如 果 想 要 制作 一 张 现 有 CD-ROM 的 iso 映像， 我们 可 以 使 用 dd 命令 来 读 取 CD-ROW 中 的 所 有 数据 块 ， 并 把 它们 复制 到 本 
地 文件 中 。 上 比如 说 我 们 有 一 张 Ubuntu CD， 用 它 来 制作 一 个 iso 文件 ， 以 后 我 们 可 以 用 它 来 制作 更 多 的 拷贝 。 插 入 这 张 CD 
之 后 ， 确 定 它 的 设备 名 称 (假定 是 /dev/cdrom) ， 然 后 像 这 样 来 制作 iso 文件 : 


dd if=/dev/cdrom of=ubuntu.iso 


这 项 技术 也 适用 于 DVD 光盘 ， 但 是 不 能 用 于 音频 CD， 因 为 它们 不 使 用 文件 系统 来 存储 数据 。 对 于 音频 CD， 看 一 下 


cdrdao 命令 。 


从 文件 集合 中 创建 一 个 映像 


创建 一 个 包含 目录 内 容 的 iso 映像 文件 ， 我 们 使 用 genisoimage 程序 。 为 此 ， 我 们 首先 创建 一 个 目录 ， 这 个 目录 中 包含 了 要 
包括 到 此 映像 中 的 所 有 文件 ， 然 后 执行 这 个 genisoimage 命令 来 创建 映像 文件 。 例 如 ， 如 果 我 们 已 经 创建 一 个 叫做 ~/cd- 
rom-files 的 目录 ， 然 后 用 文件 填充 此 目录 ， 再 通过 下 面 的 命令 来 创建 一 个 叫做 cd-rom.iso 映像 文件 : 


genisoimage -o cd-rom.iso -R - ~/cd-rom-files 


"-R" 选 项 添加 元 数据 为 Rock Ridge 扩展 ， 这 允许 使 用 长 文件 名 和 POSIX 风格 的 文件 权限 。 同样 地 ， 这 个 "-] 了 "选项 使 Joliet 
扩展 生效 ， 这 样 Windows 中 就 支持 长 文件 名 了 。 


如 果 你 看 一 下 关于 创建 和 烧 写 光 介 质 如 CD-ROMs 和 DVD 的 在 线 文档 ， 你 会 经 常 碰 到 两 个 程序 叫做 mkisofs 和 
cdrecord。 这 些 程序 是 流行 软件 包 "cdrtools" 的 一 部 分 ，"cdrtools" 由 Jorg Schilling 编写 成 。 在 2006 年 春天 ，Schilling 
先生 更 改 了 部 分 cdrtools 软件 包 的 协议 ， 许 多 Linux 社区 的 意见 是 ， 这 创建 了 一 个 与 GNU GPL 不 相 兼 容 的 协议 。 结 
果 ， 就 fork 了 这 个 cdrtools 项 目 ， 目前 新 项 目 里 面包 含 cdrecord 和 mkisofs 的 替代 程序 ， 分 别 是 wodim 和 
genisoimage。 















































写 入 CD-ROM 镜像 


有 了 一 个 映像 文件 之 后 ， 我 们 可 以 把 它 烧 写 到 光盘 中 。 下 面 讨 论 的 大 多 数 命 令 对 可 记录 的 CD-ROW 和 DVD 媒介 都 适用 。 


直接 挂 载 一 个 ISO 镜像 





有 一 个 诀 穿 ， 我 们 可 以 用 它 来 挂 裁 iso 映像 文件 ， 虽 然 此 文件 仍然 在 我 们 的 硬盘 中 ， 但 我 们 当 作 它 已 经 在 光盘 中 了 。 添 加 "-o 
loop" 选项 来 挂 裁 〈 同 时 带 有 必需 的 "tiso9660" 文件 系统 类 型 ) ， 挂 载 这 个 映像 文件 就 好 像 它 是 一 台 设 备 ， 把 它 连接 到 文件 


系统 树 上 : 


mkdir /mnt/iso_image 
mount -t is09660 -0 loop image.iso /mnt/iso_image 


上 面 的 示例 中 ， 我 们 创建 了 一 个 挂 裁 点 叫做 /mntiso_image， 然 后 把 此 映像 文件 image.iso 挂 载 到 挂 载 点 上 。 了 映像 文件 被 挂 
载 之 后 ， 可 以 把 它 当 作 ， 就 好 像 它 是 一 张 真正 的 CD-ROM 或 者 DVD。 当 不 再 需要 此 了 映像 文件 后 ， 记 得 卸载 它 。 


清除 一 张 可 重 写 入 的 CD-ROM 


可 重 写 入 的 CD-RW 媒介 在 被 重 使 用 之 前 需要 擦 除 或 清空 。 为 此 ， 我 们 可 以 用 wodim 命 伟 ， 指 定 设备 名 称 和 清空 的 类 型 。 
此 wodim 程序 提供 了 几 种 清空 类 型 。 最 小 〈 且 最 快 ) 的 是 "fast" 类 型 : 


wodim dev=/dev/cdrw blank=fast 


写 人 镜像 


写 入 一 个 映像 文件 ， 我 们 再 次 使 用 wodim 命 舍 ， 指 定 光盘 设备 名 称 和 映像 文件 名 : 


wodim dev=/dev/cdrw image.iso 


除了 设备 名 称 和 了 映像 文件 之 外 ，wodim 命令 还 支持 非常 多 的 选项 。 常 见 的 两 个 选项 是 ，"-V" 可 详细 输出 ， 和 "一 dao" 以 disk- 
at-once 模式 写 入 光盘 。 如 果 你 正在 准备 一 张 光 盘 为 的 是 商业 复制 ， 那 么 应 该 使 用 这 种 模式 。 wodim 命令 的 默认 模式 是 
track-at-once， 这 对 于 录制 音乐 很 有 用 。 


拓展 阅读 


我 们 刚才 谈 到 了 很 多 方法 ， 可 以 使 用 命令 行 管理 存储 介质 。 看 看 我 们 所 讲 过 命令 的 手册 页 。 一 些 命令 支持 大 量 的 选项 和 操 
作 。 此 外 ， 寻 找 一 些 如 何 添加 硬盘 驱动 器 到 Linux 系统 (有 许多 ) 的 在 线 教程 ， 这 些 教程 也 要 适用 于 光 介 质 存储 设备 。 





友情 提示 


通常 验证 一 下 我 们 已 经 下 载 的 iso 映像 文件 的 完整 性 很 有 用 处 。 在 大 多 数 情况 下 ，iso 映像 文件 的 贡献 者 也 会 提供 一 个 
checksum 文件 。 一 个 checksum 是 一 个 神奇 的 数学 运算 的 计算 结果 ， 这 个 数学 计算 会 产生 一 个 能 表示 目标 文件 内 容 的 数 
字 。 如 果 目 标 文件 的 内 容 即 使 更 改 一 个 二 进 制 位 ，checksum 的 结果 将 会 非常 不 一 样 。 生成 checksum 数字 的 最 常见 方法 是 
使 用 md5sum 程序 。 当 你 使 用 md5sum 程序 的 时 候 ， 它 会 产生 一 个 独一无二 的 十 六 进 制 数字 : 


md5sum image.iso 
34e354760f9bb7fbf85c96f6a3f94ece image.iso 


当 你 下 载 完 映像 文件 之 后 ， 你 应 该 对 映像 文件 执行 md5sum 命令 ， 然 后 把 运行 结果 和 与 发 行商 提供 的 md5sum 数值 作 比 较 。 


除了 检查 下 载 文件 的 完整 性 之 外 ， 我 们 也 可 以 使 用 md5sum 程序 验证 新 写 入 的 光学 存储 介质 。 为 此 ， 首 先 我 们 计算 映像 文 
件 的 checksum 数值 ， 然 后 计算 此 光学 存储 介质 的 checksum 数值 。 这 种 验证 光学 介质 的 技巧 是 限定 只 对 光学 存储 介质 中 
包含 映像 文件 的 部 分 计算 checksum 数值 。 通过 确定 映像 文件 所 包含 的 2048 个 字 节 块 的 数目 (光学 存储 介质 总 是 以 2048 
个 字 节 块 的 方式 写 入 ) 并 从 存储 介质 中 读 取 那 么 多 的 字 节 块 ， 我 们 就 可 以 完成 操作 。 某 些 类 型 的 存储 介质 ， 并 不 需要 这 样 
做 。 一 个 以 disk-at-once 模式 写 入 的 CD-R， 可 以 用 下 面 的 方式 检验 : 


md5sum /dev/cdrom 
34e354760f9bb7fbf85c96f6a3f94ece /dev/cdrom 


许多 存储 介质 类 型 ， 如 DVD 需要 精确 地 计算 字 节 块 的 数目 。 在 下 面 的 例子 中 ， 我 们 检验 了 映像 文件 dvd-image.iso 以 及 


DVD 光驱 中 磁盘 /dev/dvd 文件 的 完整 性 。 你 能 弄 明白 这 是 怎么 回 事 吗 ? 


md5sum dvd-image.iso; dd if=/dev/dvd bs=2048 count=$(( $(stat -c "%s" dvd-image.iso) / 2048 )) | md5sum 


网 络 系统 


当 谈 及 到 网 络 系统 层面 ， 几 乎 任何 东西 都 能 由 Linux 来 实现 。Linux 被 用 来 创建 各 式 各 样 的 网 络 系统 和 装置 ， 包括 防火 墙 ， 
路 由 器 ， 名 称 服务 器 ， 网 络 连接 式 存储 设备 等 等 。 


命 





被 用 来 配置 和 操作 网 络 系统 的 命令 数目 ， 就 如 网 络 系统 一 样 巨大 。 我 们 仅仅 会 关注 一 些 最 经 常 使 用 到 的 命令 。 我 们 要 研究 的 
命令 包括 那些 被 用 来 监测 网 络 和 传输 文件 的 命 舍 。 另 外 ， 我 们 还 会 探讨 用 来 远 端 登录 的 ssh 程序 。 这 章 会 介绍 : 


倒 
介 
e ping - 发 送 ICMP ECHO_REQUEST 软件 包 到 网 络 主机 

e traceroute - 打印 到 一 台 网 络 主机 的 路 由 数据 包 

e netstat - 打印 网 络 连接 ， 路 由 表 ， 接 口 统计 数据 ， 伪 装 连接 ， 和 多 路 广播 成 员 

eftp - 因特网 文件 传输 程序 

e wget- 非 交 互 式 网 络 下 载 器 

e ssh - OpenSSH SSH 客户 端 (远程 登录 程序 ) 


我 们 假定 你 已 经 知道 了 一 点 网 络 系统 背景 知识 。 在 这 个 因特网 时 代 ， 每 个 计算 机 用 户 需要 理解 基本 的 网 络 系统 概念 。 为 了 能 
够 充分 利用 这 一 章节 的 内 容 ， 我 们 应 该 熟悉 以 下 术语 : 


e。 IP (网 络 协议 ) 地 址 

e 主机 和 域名 

e。 URI (统一 资源 标识 符 ) 

请 查看 下 面 的 “拓展 阅读 "部 分 ， 有 几 篇 关于 这 些 术 语 的 有 用 文章 。 


注意 : 一 些 将 要 讲 到 的 命令 可 能 (取决 于 系统 发 行 版 ) 需 要 从 系统 发 行 版 的 仓库 中 安装 额外 的 软件 包 ， 并 且 一 些 命令 可 能 需 
要 超级 用 户 权 限 才 能 执行 。 


检查 和 监测 网 络 
即使 你 不 是 一 名 系统 管理 员 ， 检 查 一 个 网 络 的 性 能 和 运作 情况 也 是 经 常 有 帮助 的 。 


最 基本 的 网 络 命令 是 ping。 这 个 ping 命令 发 送 一 个 特殊 的 网 络 数据 包 ， 叫 做 IMCP ECHO_REQUEST， 到 一 台 指定 的 主 
机 。 大 多 数 接收 这 个 包 的 网 络 设备 将 会 回复 它 ， 来 允许 网 络 连接 验证 。 


注意 : 大 多 数 网 络 设备 〈 包 括 Linux 主机 ) 都 可 以 被 配置 为 忽略 这 些 数 据 包 。 通 常 ， 这 样 做 是 出 于 网 络 安全 原因 ， 部 分 地 庶 
蔽 一 台 主 机 免 受 一 个 潜在 攻击 者 地 侵袭 。 配 置 防 火 墙 来 阻塞 IMCP 流量 也 很 普通 。 


例如 ， 看 看 我 们 能 否 连接 到 网 站 linuxcommand.org (我 们 最 喜欢 的 网 站 之 一 ) ， 我 们 可 以 这 样 使 用 ping 命令 : 
[me@linuxbox ~]$ ping linuxcommand.org 


一 旦 启动 ，ping 命令 会 持续 在 特定 的 时 间 间 隔 内 (默认 是 一 秒 ) 发 送 数据 包 ， 直 到 它 被 中 断 : 


[me@linuxbox ~]$ ping linuxcommand.org 

PING linuxcommand.org (66.35.250.210) 56(84) bytes of data. 

64 bytes from vhost.sourceforge.net (66.35.250.210): icmp\ seq=1 
=43 time=107 ms 

64 bytes from vhost.sourceforge.net (66.35.250.210): icmp\ seq=2 
=43 time=108 ms 

64 bytes from vhost.sourceforge.net (66.35.250.210): icmp\ seq=3 
=43 time=106 ms 

64 bytes from vhost.sourceforge.net (66.35.250.210): icmp\ seq=4 
=43 time=106 ms 

64 bytes from vhost.sourceforge.net (66.35.250.210): icmp\ seq=5 
=43 time=105 ms 











按 下 组 合 键 Ctll-c， 中 断 这 个 命令 之 后 ，ping 打印 出 运行 统计 信息 。 一 个 正常 工作 的 网 络 会 报告 需 个 数据 包 丢 失 。 一 个 成 功 
执行 的 "ping" 命 今 会 意味 着 网 络 的 各 个 部 件 (网 卡 ， 电 绕 ， 路 由 ， 网 关 ) 都 处 于 正常 的 工作 状态 。 


这 个 traceroute 程序 (一些 系统 使 用 相似 的 tracepath 程序 来 代替 ) 会 显示 从 本 地 到 指定 主机 要 经 过 的 所 有 "“ 跳 数 " 的 网 络 流 
量 列表 。 例 如 ， 看 一 下 到 达 slashdot.org 网 站 ， 需 要 经 过 的 路 由 器 ， 我 们 将 这 样 做 : 


[me@linuxbox ~]$ traceroute slashdot.org 


命令 输出 看 起 来 像 这 样 : 


traceroute to slashdot.org (216.34.181.45), 30 hops max, 40 byte 
packets 

1 ipcop.localdomain (192.168.1.1) 1.066 ms 1.366 ms 1.720 ms 

2 炒米 米 

3 ge-4-13-ur01.rockville.md.bad.comcast.net (68.87.130.9) 14.622 
ms 14.885 ms 15.169 ms 

4 po-30-ur02.rockville.md.bad.comcast.net (68.87.129.154) 17.634 
ms 17.626 ms 17.899 ms 

5 po-60-ur03.rockville.md.bad.comcast.net (68.87.129.158) 15.992 
ms 15.983 ms 16.256 ms 

6 po-30-ar01.howardcounty.md.bad.comcast.net (68.87.136.5) 22.835 


从 输出 结果 中 ， 我 们 可 以 看 到 连接 测试 系统 到 slashdot.org 网 站 需要 经 由 16 个 路 由 器 。 对 于 那些 提供 标识 信息 的 路 由 器 ， 我 
们 能 看 到 它们 的 主机 名 ，IP 地 址 和 性 能 数据 ， 这 些 数据 包括 三 次 从 本 地 到 此 路 由 器 的 往返 时 间 样 本 。 对 于 那些 没有 提供 标识 
填 息 的 路 由 器 〈 由 于 路 由 器 配置 ， 网 络 拥塞 ， 防 火 墙 等 方面 的 原因 ) ， 我 们 会 看 到 几 个 星 号 ， 正 如 行 中 所 示 。 


netstat 程序 被 用 来 检查 各 种 各 样 的 网 络 设置 和 统计 数据 。 通 过 此 命令 的 许多 选项 ， 我 们 可 以 看 看 网 络 设置 中 的 各 种 特性 。 使 
用 "“-ie” 选 项 ， 我 们 能 够 查看 系统 中 的 网 络 接口 : 


[me@linuxbox ~]$ netstat -ie 

eth0 Link encap:Ethernet HWaddr 00:1d:09:9b:99:67 
inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0 
inet6 addr: fe80::21d:9ff:fe9b:9967/64 Scope:Link 
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 
RX packets:238488 errors:0 dropped:0 overruns:0 frame:0 
TX packets:403217 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:100 RX bytes:153098921 (146.0 MB) TX 
bytes:261035246 (248.9 MB) Memory:fdfc0000-fdfe0000 


lo Link encap:Local Loopback 
inet addr:127.0.0.1 Mask:255.0.0.0 


在 上 述 实例 中 ， 我 们 看 到 我 们 的 测试 系统 有 两 个 网 络 接口 。 第 一 个 ， 叫 做 eth0， 是 因特网 接口 ， 和 第 二 个 ， 叫 做 Ilo， 是 内 部 
回环 网 络 接口 ， 它 是 一 个 虚拟 接口 ， 系 统 用 它 来 “ 自 言 自 语 "。 


当 执 行 日 常 网 络 诊断 时 ， 要 查看 的 重要 信息 是 每 个 网 络 接 口 第 四 行 开头 出 现 的 单词 “UP”， 说 明 这 个 网 络 接口 已 经 生效 ， 还 要 
查看 第 二 行 中 inet addr 字段 出 现 的 有 效 IP 地 址 。 对 于 使 用 DHCP (动态 主机 配置 协议 ) 的 系统 ， 在 这 个 字段 中 的 一 个 有 效 


IP 地 址 则 证 明了 DHCP 工作 正常 。 


使 用 这 个 “-P 选 项 会 显示 内 核 的 网 络 路 由 表 。 这 展示 了 系统 是 如 何 配置 网 络 之 间 发 送 数据 包 的 。 


[me@linuxbox ~]$ netstat -r 
Kernel IP routing table 


Destination Gateway Genmask Flags MSS Window irtt lface 
L926831000 so I) Oo 0 eth0 
default 1923168:19103030:0 UG Ome0 0 eth0 


在 这 个 简单 的 例子 里 面 ， 我 们 看 到 了 ， 位 于 防火 墙 之 内 的 局 域 网 中 ， 一 台 客 户 端 计算 机 的 典型 路 由 表 。 第 一 行 显示 了 目的 地 
192.168.1.0。IP 地 址 以 需 结尾 是 指 网 络 ， 而 不 是 个 人 主机 ， 所 以 这 个 目的 地 意味 着 局 域 网 中 的 任何 一 台 主 机 。 下 一 个 字 
段 ，Gateway， 是 网 关 (路 由 器 ) 的 名 字 或 IP 地 址 ， 用 它 来 连接 当前 的 主机 和 目的 地 的 网 络 。 若 这 个 字段 显示 一 个 星 号 ， 
则 表明 不 需要 网 关 。 


最 后 一 行 包含 目的 地 default。 指 的 是 发 往 任 何 表 上 没有 列 出 的 目的 地 网 络 的 流量 。 在 我 们 的 实例 中 ， 我 们 看 到 网 关 被 定义 为 
地 址 192.168.1.1 的 路 由 器 ， 它 应 该 能 知道 怎样 来 处 理 目的 地 流量 。 


netstat 程序 有 许多 选项 ， 我 们 仅仅 讨论 了 几 个 。 查 看 netstat 命 合 的 手册 ， 可 以 得 到 所 有 选项 的 完整 列表 。 


网 络 中 传输 文件 


网 络 有 什么 用 处 呢 ? 除非 我 们 知道 了 怎样 通过 网 络 来 传输 文件 。 有 许多 程序 可 以 用 来 在 网 络 中 传送 数据 。 我 们 先 讨论 两 个 命 
仿 ， 随 后 的 章节 里 再 介绍 几 个 命 兮 。 


ftp 命令 属于 真正 的 “经 典 ” 程 序 之 一 ， 它 的 名 字 来 源 于 其 所 使 用 的 协议 ， 就 是 文件 传输 协议 。 FTP 被 广泛 地 用 来 从 因特网 上 下 
载 文件 。 大 多 数 ， 并 不 是 所 有 的 ， 网 络 浏览 器 都 支持 FTP， 你 经 常 可 以 看 到 它们 的 URI 以 协议 tip:/ 开 头 。 在 出 现 网 络 浏览 
器 之 前 ，ftp 程序 已 经 存在 了 。 ftp 程序 可 用 来 与 FTP 服务 器 进行 通信 ，FTP 服务 器 就 是 存储 文件 的 计算 机 ， 这 些 文件 能 够 通 
过 网 络 下 载 和 上 传 。 


FTP ( 它 的 原始 形式 ) 并 不 是 安全 的 ， 因 为 它 会 以 明码 形式 发 送 帐 号 的 姓名 和 密码 。 这 就 意味 着 这 些 数 据 没有 加 密 ， 任 何 嗅 
探 网 络 的 人 都 能 看 到 。 由 于 此 种 原因 ， 几 乎 因特网 中 所 有 FTP 服务 器 都 是 匿名 的 。 一 个 匿名 服务 器 能 允许 任何 人 使 用 注册 
名 "anonymous” 和 无 意义 的 密码 登录 系统 。 





在 下 面 的 例子 中 ， 我 们 将 展示 一 个 典型 的 会 话 ， 从 匿名 FTP 服务 器 ， 其 名 字 是 fileserver， 的 /pub/_images/Ubuntu-8.04 的 
目录 下 ， 使 用 ftp 程序 下 载 一 个 Ubuntu 系统 映像 文件 。 


[me@linuxbox ~]$ ftp fileserver 

Connected to fileserver.localdomain. 

220 (vsFTPd 2.0.1) 

Name (fileserver:me): anonymous 

331 Please specify the password. 

Password: 

230 Login successful. 

Remote system type is UNIX. 

Using binary mode to transfer files. 

ftp> cd pub/cd\ images/Ubuntu-8.04 

250 Directory successfully changed. 

fpeals 

200 PORT command successful. Consider using PASV. 

150 Here comes the directory listing. 

-rw-rw-r-- 1 500 500 733079552 Apr 25 03:53 ubuntu-8.04- desktop-i386.iso 
226 Directory send OK. 

ftp> lcd Desktop 

Local directory now /home/me/Desktop 

ftp> get ubuntu-8.04-desktop-i386.iso 

local: ubuntu-8.04-desktop-i386.iso remote: ubuntu-8.04-desktop- 
i386.iso 

200 PORT command successful. Consider using PASV. 

150 Opening BINARY mode data connection for ubuntu-8.04-desktop- 
i386.iso (733079552 bytes). 

226 File send OK. 

733079552 bytes received in 68.56 secs (10441.5 kB/s) 

ftp> bye 


这 里 是 对 会 话 期 间 所 输入 命令 的 解释 说 明 : 


命 今 意思 
ftp fileserver 唤醒 ftp 程序 ， 让 它 连接 到 FTP 服务 器 ，fileserver。 
登录 名 。 输 入 登录 名 后 ， 将 出 现 一 个 密码 提示 。 一 些 服务 器 将 会 接受 空 密 
anonymous 码 ， 其 它 一 些 则 会 要 求 一 个 邮件 地 址 形式 的 密码 。 如 果 是 这 种 情况 ， 试 着 输 


入 “user@example.com"。 


跳 转 到 远 端 系统 中 ， 要 下 载 文件 所 在 的 目录 下 ， 注意 在 大 多 数 匿名 的 FTP 


全 服务 器 中 ， 支 持 公共 下 载 的 文件 都 能 在 目录 pub 下 找到 

ls 列 出 远 端 系统 中 的 目录 。 

Icd Desktop 跳 转 到 本 地 系统 中 的 ~/Desktop 目 录 下 。 在 实例 中 ，ftp 程序 在 工作 目录 ~ 
下 被 唤醒 。 这 个 命令 把 工作 目录 改 为 ~/Desktop 

get ubuntu-8.04-desktop-i386.iso 人 好 已 经 更 改 到 了 

bye 退出 远 端 服务 器 ， 结 束 ftp 程序 会 话 。 也 可 以 使 用 命令 quit 和 exit。 


在 “ftp>" 提示 符 下 ， 输 入 “help”， 会 显示 所 支持 命令 的 列表 。 使 用 f 登录 到 一 台 授予 了 用 户 足 够 权限 的 服务 器 中 ， 则 可 以 执 
行 很 多 普通 的 文件 管理 任务 。 虽然 很 笨拙 ， 但 它 真能 工作 。 


ftp 并 不 是 唯一 的 命令 行 形 式 的 FTP 客户 端 。 实 际 上 ， 还 有 很 多 。 其 中 比较 好 (也 更 流行 的 ) 是 Iftp 程序 ， 由 Alexander 
Lukyanoyv 编写 完成 。 虽 然 lftp 工作 起 来 与 传统 的 ftp 程序 很 相似 ， 但 是 它 带 有 额外 的 便捷 特性 ， 包 括 多 协议 支持 (包括 
HTTP) ， 若 下 载 失败 会 自动 地 重新 下 载 ， 后 台 处 理 ， 用 tab 按键 来 补 全 路 径 名 ， 还 有 很 多 。 


另 一 个 流行 的 用 来 下 载 文件 的 命令 行程 序 是 wget。 若 想 从 网 络 和 FTP 网 站 两 者 上 都 能 下 载 数据 ，wget 是 很 有 用 处 的 。 不 只 
能 下 载 单个 文件 ， 多 个 文件 ， 其 至 整个 网 站 都 能 下 载 。 下 载 linuxcommand.org 网 站 的 首页 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ wget http://linuxcommand.org/index.php 
--11:02:51-- http://linuxcommand.org/index.php 

=> ‘index.php' 
Resolving linuxcommand.org.… 66.35.250.210 
Connecting to linuxcommand.org|66.35.250.210|:80... connected. 
HTTP request sent, awaiting response... 200 OK 
Length: unspecified [text/html] 


bss => ] S120 --.--K/s 


11:02:51 (161.75 MB/s) - 'index.php' saved [3120] 


这 个 程序 的 许多 选项 允许 wget 递归 地 下 载 ， 在 后 台 下 载 文件 〈 你 退出 后 仍 在 下 载 ) ， 能 完成 未 下 载 全 的 文件 。 这 些 特性 在 
命令 手册 ，better-than-average 一 节 中 有 详尽 地 说 明 。 


与 远程 主机 安全 通信 


通过 网 络 来 远程 操控 类 似 Unix 的 操作 系统 已 经 有 很 多 年 了 。 早 些 年 ， 在 因特网 普通 推广 之 前 ， 有 一 些 受 欢迎 的 程序 被 用 来 
登录 远程 主机 。 它 们 是 rlogin 和 telnet 程序 。 然 而 这 些 程序 ， 拥 有 和 ftp 程序 一 样 的 致命 缺点 ; 它们 以 明码 形式 来 传输 所 有 
的 交流 信息 (包括 登录 命 合 和 密码 ) 。 这 使 它们 完全 不 适合 使 用 在 因特网 时 代 。 


为 了 解决 这 个 问题 ， 开 发 了 一 款 新 的 协议 ， 叫 做 SSH (Secure Shell) 。 SSH 解决 了 这 两 个 基本 的 和 远 端 主机 安全 交流 的 
问题 。 首 先 ， 它 要 认证 远 端 主机 是 否 为 它 所 知道 的 那 台 主机 (这 样 就 阻止 了 所 谓 的 “中 间 人 "的 攻击 ) ， 其 次 ， 它 加 密 了 本 地 
与 远程 主机 之 间 所 有 的 通讯 信息 。 


SSH 由 两 部 分 组 成 。SSH 服务 器 运行 在 远 端 主机 上 运行 ， 在 端口 号 22 上 监听 将 要 到 来 的 连接 ， 而 SSH 客户 端 用 在 本 地 系统 
中 ， 用 来 和 远 端 服务 器 通信 。 


大 多 数 Linux 发 行 版 自 带 一 个 提供 SSH 功能 的 软件 包 ， 叫 做 OpenSSH， 来 自 于 BSD 项 目 。 一 些 发 行 版 默认 包含 客户 端 和 
服务 器 端 两 个 软件 包 (例如 ，Red Hat) ,而 另 一 些 (比方 说 Ubuntu) 则 只 是 提供 客户 端 服务 。 为 了 能 让 系统 接受 远 端的 连 
接 ， 它 必须 安装 OpenSSH-server 软件 包 ， 配 置 ， 运 行 它 ， 并 且 (如 果 系 统 正在 运行 ， 或 者 是 在 防火 墙 之 后 ) 它 必须 允许 
在 TCP 端口 号 上 接收 网 络 连 接 。 


小 贴 示 : 如 果 你 没有 远 端 系统 去 连接 ， 但 还 想 试 试 这 些 实例 ， 则 确认 安装 了 OpenSSH-server 软件 包 ， 则 可 使 用 localhost 
作为 远 端 主机 的 名 字 。 这 种 情况 下 ， 计 算 机 会 和 它 自己 创建 网 络 连 接 。 


用 来 与 远 端 SSH 服务 器 相连 接 的 SSH 客户 端 程序 ， 顺 理 成 章 ， 叫 做 ssh。 连 接 到 远 端 名 为 remote-sys 的 主机 ， 我 们 可 以 这 
样 使 用 ssh 客户 端 程序 : 


[me@linuxbox ~]$ ssh remote-sys 

The authenticity of host 'remote-sys (192.168.1.4)' can't be 
established. 

RSA key fingerprint is 
41:ed:7a:df:23:19:bf:3c:a5:17:bc:61:b3:7f:d9:bb. 

Are you sure you want to continue connecting (yes/no)? 


第 一 次 尝试 连接 ， 提 示 信 息 表明 远 端 主机 的 真实 性 不 能 确立 。 这 是 因为 客户 端 程序 以 前 从 没有 看 到 过 这 个 远 端 主机 。 为 了 接 
受 远 端 主机 的 身份 验证 凭据 ， 输 入 “yes”"。 一 旦 建立 了 连接 ， 会 提示 用 户 输入 他 或 她 的 密码 : 


Warning: Permanently added 'remote-sys,192.168.1.4' (RSA) to the list 
of known hosts. 
me@remote-sys's password: 


成 功 地 输入 密码 之 后 ， 我 们 会 接收 到 远 端 系统 的 shell 提示 符 : 


Last login: Sat Aug 30 13:00:48 2008 
[me@remote-sys ~]$ 


远 端 shell 会 话 一 直 存 在 ， 直 到 用 户 输入 exit 命令 后 ， 则 关闭 了 远程 连接 。 这 时 候 ， 本 地 的 shell 会 话 恢复 ， 本 地 shell 提示 
符 重 新 出 现 。 


也 有 可 能 使 用 不 同 的 用 户 名 连接 到 远程 系统 。 例 如 ， 如 果 本 地 用 户 "me”， 在 远 端 系统 中 有 一 个 帐号 名 "bob”， 则 用 户 me 能 
够 用 bob 帐号 登录 到 远 端 系统 ， 如 下 所 示 : 


[me@linuxbox ~]$ ssh bob@remote-sys 
bob@remote-sys's password: 

Last login: Sat Aug 30 13:03:21 2008 
[bob@remote-sys ~]$ 


正如 之 前 所 讲 到 的 ，ssh 验证 远 端 主机 的 真实 性 。 如 果 远 端 主机 不 能 成 功 地 通过 验证 ， 则 会 提示 以 下 信息 : 


[me@linuxbox ~]$ ssh remote-sys 
@Q@Q@@Q@OOOOOOOOQQQOQOQOOQOOOOOOOOOQQOQOOQOOOOOOOOOOQQQOOQOOOOOOOOOOOOOO@ 
@ 

WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! 

@ 
@Q@Q@@Q@@OOOOOOOQQQOQOQOOQOOOOOOOQOQOQOQOQOOOOOOOOOOQQOOQOQOQOOOOOOOOOOOO 
ITIS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY! 

Someone could be eavesdropping on you right now (man-in-the-middle 

attack)! 


有 两 种 可 能 的 情形 会 提示 这 些 信息 。 第 一 ， 某 个 攻击 者 企图 制造 “中 间 人 "袭击 。 这 很 少见 ， 因为 每 个 人 都 知道 ssh 会 针对 这 
种 状况 发 出 警告 。 最 有 可 能 的 罪魁 祸首 是 远 端 系统 已 经 改变 了 ; 例如 ， 它 的 操作 系统 或 者 是 SSH 服务 器 重新 安装 了 。 然 
而 ， 为 了 安全 起 见 ， 第 一 个 可 能 性 不 应 该 被 轻易 否定 。 当 这 条 消息 出 现时 ， 总 要 与 远 端 系统 的 管理 员 查 对 一 下 。 


当 确定 了 这 条 消息 崩 结 为 一 个 良性 的 原因 之 后 ， 那 么 在 客户 端 更 正 问题 就 很 安全 了 。 使 用 文本 编辑 器 (可 能 是 vim) 从 文件 
~/.ssh/known_hosts 中 删除 废弃 的 钥匙 ， 就 解决 了 问题 。 在 上 面 的 例子 里 ， 我 们 看 到 这 样 一 句 话 : 


Offending key in /home/me/.ssh/known_hosts:1 


这 意味 着 文件 known_hosts 里 面 某 一 行 包 含 攻击 型 的 钥匙 。 从 文件 中 删除 这 一 行 ， 则 ssh 程序 就 能 够 从 远 端 系统 接受 新 的 
身份 验证 凭据 。 


除了 能 够 在 远 端 系统 中 打开 一 个 shell 会 话 ，ssh 程序 也 允许 我 们 在 远 端 系统 中 执行 单个 命令 。 例如 ， 在 名 为 remote-sys 的 
远 端 主机 上 ， 执 行 free 命令 ， 并 把 输出 结果 显示 到 本 地 系统 shell 会 话 中 。 


[me@linuxbox ~]$ ssh remote-sys free 
me@twin4's password : 
total used free shared buffers cached 


Mem: VDSS0 5071840268352 0 110068 154596 


-/+ buffers/cache: 242520 533016 
Swap: 0 1572856 0 110068 154596 


[me@linuxbox ~]$ 


有 可 能 以 更 有 趣 的 方式 来 利用 这 项 技术 ， 比 方 说 下 面 的 例子 ， 我 们 在 远 端 系统 中 执行 |s 命令 ， 并 把 命令 输出 重 定向 到 本 地 系 
统 中 的 一 个 文件 里 面 。 


[me@linuxbox ~]$ ssh remote-sys 'Is \*' > dirlist.txt 
me@twin4's password: 
[me@linuxbox ~]$ 


注意 ， 上 面 的 例子 中 使 用 了 单 引 号 。 这 样 做 是 因为 我 们 不 想 路 径 名 展开 操作 在 本 地 执行 ; 而 希望 它 在 远 端 系统 中 被 执行 。 同 
样 地 ， 如 果 我 们 想 要 把 输出 结果 重 定向 到 远 端 主机 的 文件 中 ， 我 们 可 以 把 重 定向 操作 符 和 文件 名 都 放 到 单 引 号 里 面 。 


[me@linuxbox ~]$ ssh remote-sys 'ls * > dirlist.txt' 


SSH 通道 


当 你 通过 SSH 协议 与 远 端 主机 建立 连接 的 时 候 ， 其 中 发 生 的 事 就 是 在 本 地 和 与 远 端 系统 之 间 创建 了 一 条 加 密 通 道 。 通 
常 ， 这 条 通道 被 用 来 把 在 本 地 系统 中 输入 的 命令 安全 地 传输 到 远 端 系 统 ， 同样 地 ， 再 把 执行 结果 安全 地 发 送 回来 。 除 
了 这 个 基本 功能 之 外 ，SSH 协议 允许 大 多 数 网 络 流量 类 型 通过 这 条 加 密 通道 来 被 传送 ， 在 本 地 与 远 端 系统 之 间 创 建 某 
种 VPN (虚拟 专用 网 络 ) 。 






































可 能 这 个 特性 的 最 普遍 使 用 是 允许 传递 X 窗口 系统 流量 。 在 运行 着 X 服务 器 (也 就 是 ， 能 显示 GUI 的 机 器 ) 的 系统 
中 ， 有 可 能 在 远 端 启 动 和 运行 一 个 X 客户 端 程序 〈 一 个 图 形 化 应 用 程序 ) ， 而 应 用 程序 的 显示 结果 出 现在 本 地 。 这 很 
容易 完成 ， 这 里 有 个 例子 : 假设 我 们 正 坐 在 一 台 装 有 Linux 系统 ， 叫做 linuxbox 的 机 器 之 前 ， 且 系统 中 运行 着 X 服务 
器 ， 现 在 我 们 想 要 在 名 为 remote-sys 的 远 端 系统 中 运行 xload 程序 ， 但 是 要 在 我 们 的 本 地 系统 中 看 到 这 个 程序 的 图 
化 输出 。 我 们 可 以 这 样 做 : 


























NS 





[me@linuxbox ~]$ ssh -X remote-sys 
me@remote-sys's password: 

Last login: Mon Sep 08 13:23:11 2008 
[me@remote-sys ~]$ xload 


这 个 xload 命令 在 远 端 执 行 之 后 ， 它 的 窗口 就 会 出 现在 本 地 。 在 某 些 系 统 中 ， 你 可 能 需要 使 用 “一 Y" 选 项 ， 而 不 是 “一 
X" 选 项 来 完成 这 个 操作 。 





这 个 OpenSSH 软件 包 也 包含 两 个 程序 ， 它 们 可 以 利用 SSH 加 密 通道 在 网 络 间 复 制 文 件 。 第 一 个 ，scp (安全 复制 ) 被 用 来 
复制 文件 ， 与 熟悉 的 cp 程序 非常 相似 。 最 显著 的 区 别 就 是 源 或 者 目标 路 径 名 要 以 远 端 主机 的 名 字 ， 后 跟 一 个 冒号 字符 开 
头 。 例 如 ， 如 果 我 们 想 要 从 远 端 系统 ，remote-sys， 的 主 目录 下 复制 文档 documenttxt， 到 我 们 本 地 系统 的 当前 工作 目录 
下 ， 可 以 这 样 操作 : 


[me@linuxbox ~]$ scp remote-sys:document.txt . 
me@remote-sys's password: 

document.txt 

100% 5581 5.5KB/s 00:00 
[me@linuxbox ~]$ 


和 ssh 命 邻 一样， 如 果 你 所 期 望 的 远 端 主机 帐户 与 你 本 地 系统 中 的 不 一 致 ， 则 可 以 把 用 户 名 添加 到 远 端 主机 名 的 开头 。 


[me@linuxbox ~]$ scp bob@remote-sys:document.txt . 


第 二 个 SSH 文件 复制 命令 是 sftp， 正 如 其 名 字 所 示 ， 它 是 fp 程序 的 安全 蔡 代 品 。sftp 工作 起 来 与 我 们 之 前 使 用 的 ftp 程序 
很 相似 ; 然而 ， 它 不 用 明码 形式 来 传递 数据 ， 它 使 用 加 密 的 SSH 通道 。sftp 有 一 个 重要 特性 强 于 传统 的 ftp 命令 ， 就 是 sftp 
不 需要 远 端 系统 中 运行 FTP 服务 器 。 它 仅仅 要 求 SSH 服务 器 。 这 意味 着 任何 一 台 能 用 SSH 客户 端 连接 的 远 端 机 器 ， 也 可 
当 作 类 似 于 FTP 的 服务 器 来 使 用 。 这 里 是 一 个 样本 会 话 : 


[me@linuxbox ~]$ sftp remote-sys 

Connecting to remote-sys... 

me@remote-sys's password: 

sftp> ls 

ubuntu-8.04-desktop-i386.iso 

sftp> lcd Desktop 

sftp> get ubuntu-8.04-desktop-i386.iso 

Fetching /home/me/ubuntu-8.04-desktop-i386.iso to ubuntu-8.04- 
desktop-i386.iso 

/home/me/ubuntu-8.04-desktop-i386.iso 100% 699MB 7.4MB/s 01:35 
sftp> bye 


小 贴 示 : 这 个 SFTP 协议 被 许多 Linux 发 行 版 中 的 图 形 化 文件 管理 器 支持 。 使 用 Nautilus (GNOME), 或 者 是 Konqueror 
(KDE)， 我 们 都 能 在 位 置 栏 中 输入 以 sftp:/ 开 头 的 URI， 来 操作 存储 在 运行 着 SSH 服务 器 的 远 端 系统 中 的 文件 。 


Windows 中 的 SSH 客户 端 


比方 说 你 正 坐 在 一 台 Windows 机 器 前 面 ， 但 是 你 需要 登录 到 你 的 Linux 服务 器 中 ， 去 完成 一 些 实际 的 工作 ， 那 该 怎 
么 办 呢 ?当然 是 得 到 一 个 Windows 平台 下 的 SSH 客户 端 ! 有 很 多 这 样 的 工具 。 最 流行 的 可 能 就 是 由 Simon Tatham 
和 他 的 团队 开发 的 PuTTY 了 。 这 个 PUTTY 程序 能 够 显示 一 个 终端 窗口 ， 而 且 人 允许 Windows 用 户 在 远 端 主机 中 打开 
一 个 SSH (或 者 telnet) 会 话 。 这 个 程序 也 提供 了 scp 和 sftp 程序 的 类 似 物 。 





PuTTY 可 在 链接 http:/www.chiark.greenend.org.UK/~sgtatham/putty/ 处 得 到 。 
拓展 阅读 
e Linux 文档 项 目 提供 了 Linux 网 络 管理 指南 ， 可 以 广泛 地 (虽然 过 时 了 ) 了 解 网 络 管理 方面 的 知识 。 
http:/Aldp.org/LDP/nag2/index.html 
e Wikipedia 上 包含 了 许多 网 络 方面 的 优秀 文章 。 这 里 有 一 些 基础 的 : 
http://en.wikipedia.org/wiki/Internet_protocol_address 
http://en.wikipedia.org/wiki/Host_name 


http://en.wikipedia.org/Wwiki/Uniform_Resource_ldentifier 


查找 文件 


因为 我 们 已 经 浏览 了 Linux 系统 ， 所 以 一 件 事 已 经 变 得 非常 清楚 : 一 个 典型 的 Linux 系统 包含 很 多 文件 ! 这 就 引发 了 一 个 问 
题 , “我 们 怎样 查找 未 西 ?"。 虽 然 我 们 已 经 知道 Linux 文件 系统 良好 的 组 织 结构 ， 是 源 自 类 似 于 Unix 的 操作 系统 代 代 传承 的 
习俗 。 但 是 仅 文件 数量 就 会 引起 可 怕 的 问题 。 在 这 一 章 中 ， 我 们 将 察看 两 个 用 来 在 系统 中 查找 文件 的 工具 。 这 些 工 具 是 : 


。 locate -- 通过 名 字 来 查找 文件 
e find 一 在 目录 层次 结构 中 搜索 文件 
我 们 也 将 看 一 个 经 常 与 文件 搜索 命令 一 起 使 用 的 命令 ， 它 用 来 处 理 搜索 到 的 文件 列表 : 
e Xargs 一 从 标准 输入 生成 和 执行 命令 行 
另外 ， 我 们 将 介绍 两 个 命令 来 协助 我 们 探索 : 
e touch 一 更 改 文件 时 间 


e stat 一 显示 文件 或 文件 系统 状态 


locate - 查找 文件 的 简单 方法 


这 个 locate 程序 快速 搜索 路 径 名 数据 库 ， 并 且 输 出 每 个 与 给 定 字符 串 相 匹 配 的 文件 名 。 比 如 说 ， 例如 ， 我 们 想 要 找到 所 有 名 
字 以 “zip” 开 头 的 程序 。 因 为 我 们 正在 查找 程序 ， 可 以 假定 包含 匹配 程序 的 目录 以 "bin/" 结 尾 。 因 此 ， 我 们 试 着 以 这 种 方式 使 用 
locate 命令 ， 来 找到 我 们 的 文件 : 


[me@linuxbox ~]$ locate bin/zip 
locate 命令 将 会 搜索 它 的 路 径 名 数据 库 ， 输 出 任 一 个 包含 字符 串 "bin/zip" 的 路 径 名 : 


/usr/bin/zip 
/usr/bin/zipcloak 
/usr/bin/zipgrep 
/usr/bin/zipinfo 
/usr/bin/zipnote 
/usr/bin/zipsplit 


如 果 搜 索要 求 没有 这 么 简单 ，locate 可 以 结合 其 它 工 具 ， 上 比如 说 grep 命 舍 ， 来 设计 更 加 有 趣 的 搜索 : 


[me@linuxbox ~]$ locate zip | grep bin 
/bin/bunzip2 
/bin/bzip2 
/bin/bzip2recover 
/bin/gunzip 
/bin/gzip 
/usr/bin/funzip 
/usr/bin/gpg-zip 
/usr/bin/preunzip 
/usr/bin/prezip 
/usr/bin/prezip-bin 
/usr/bin/unzip 
/usr/bin/unzipsfx 
/usr/bin/zip 
/usr/bin/zipcloak 
/usr/bin/zipgrep 
/usr/bin/zipinfo 
/usr/bin/zipnote 
/usr/bin/zipsplit 


这 个 locate 程序 已 经 存在 了 很 多 年 了 ， 它 有 几 个 不 同 的 变 体 被 普通 使 用 着 。 在 现在 Linux 发 行 版 中 发 现 的 两 个 最 常见 的 变 体 
是 slocate 和 mlocate， 但 是 通常 它们 被 名 为 locate 的 符号 链接 访问 。 不 同 版 本 的 locate 命令 拥有 重复 的 选项 集合 。 一 些 版 


本 包括 正则 表达 式 匹配 (我们 会 在 下 一 章 中 讨论 ) 和 通配符 支持 。 查 看 locate 命令 的 手册 ， 从 而 确定 安装 了 哪个 版 本 的 
locate 程序 。 





locate 数据 库 来 自 何方 ? 





你 可 能 注意 到 了 ， 在 一 些 发 行 版 中 ， 仅 仅 在 系统 安装 之 后 ，locate 不 能 工作 ， 但 是 如 果 你 第 二 天 再 试 一 下 ， 它 就 工作 
正常 了 。 怎 么 回 事 呢 ?locate 数据 库 由 另 一 个 叫做 updatedb 的 程序 创建 。 通 常 ， 这 个 程序 作为 一 个 cron 工作 例 程 周 
期 性 运转 ; 也 就 是 说 ， 一 个 任务 在 特定 的 时 间 间 隔 内 被 cron 守护 进程 执行 。 大 多 数 装 有 locate 的 系统 会 每 隔 一 天 运 
行 一 回 updatedb 程序 。 因 为 数据 库 不 能 被 持续 地 更 新 ， 所 以 当 使 用 locate 时 ， 你 会 发 现 目前 最 新 的 文件 不 会 出 现 。 

为 了 克服 这 个 问题 ， 有 可 能 手动 运行 updatedb 程序 ， 更改 为 超级 用 户 身份 ， 在 提示 符 下 运行 updatedb 命令 。 











find - 查找 文件 的 复杂 方式 

locate 程序 只 能 依据 文件 名 来 查找 文件 ， 而 find 程序 能 基于 各 种 各 样 的 属性 ， 搜索 一 个 给 定 目录 (以 及 它 的 子 目录 ) ， 来 查 
找 文 件 。 我 们 将 要 花费 大 量 的 时 间 学 习 find 命 舍 ， 因 为 它 有 许多 有 趣 的 特性 ， 当 我 们 开始 在 随后 的 章节 里 面 讨论 编程 概念 的 
时 候 ， 我 们 将 会 重复 看 到 这 些 特性 。 


find 命令 的 最 简单 使 用 是 ， 搜 索 一 个 或 多 个 目录 。 例 如 ， 输 出 我 们 的 主 目 录 列 表 。 
[me@linuxbox ~]$ find ~ 


对 于 最 活路 的 用 户 帐 号 ， 这 将 产生 一 张 很 大 的 列表 。 因 为 这 张 列表 被 发 送 到 标准 输出 ， 我 们 可 以 把 这 个 列表 管道 到 其 它 的 程 
序 中 。 让 我 们 使 用 wc 程序 来 计算 出 文件 的 数量 : 


[me@linuxbox ~]$ find ~ | wc -I 
47068 


哇 ， 我 们 一 直 很 忙 ! fnd 命令 的 美丽 所 在 就 是 它 能 够 被 用 来 识别 符合 特定 标准 的 文件 。 它 通过 (有 点 奇怪 ) 应 用 选项 ， 测 试 
条 件 ， 和 操作 来 完成 搜索 。 我 们 先 看 一 下 测试 条 件 。 


Tests 


比如 说 我 们 想 要 目录 列表 。 我 们 可 以 添加 以 下 测试 条 件 : 


[me@linuxbox ~]$ find ~ -type d | wc -I 
1695 


添加 测试 条 件 -type d 限制 了 只 搜索 目录 。 相 反 地 ， 我 们 使 用 这 个 测试 条 件 来 限定 搜索 普通 文件 : 


[me@linuxbox ~]$ find ~ -type f | wc -I 
BS 


这 里 是 find 命令 支持 的 普通 文件 类 型 测试 条 件 : 


表 18-1: find 文件 类 型 


文件 类 型 描述 
b 块 设备 文件 
C 字符 设备 文件 
d 目录 
f 普通 文件 


| 符号 链接 


我 们 也 可 以 通过 加 入 一 些 额外 的 测试 条 件 ， 根 据 文件 大 小 和 文件 名 来 搜索 : 让 我 们 查找 所 有 文件 名 匹配 通配符 模式 “*.JPG”" 和 
文件 大 小 大 于 1M 的 文件 : 


[me@linuxbox ~]$ find ~ -typef-name "\*.JPG" -size +1M | wc -| 
840 





在 这 个 例子 里 面 ， 我 们 加 入 了 -name 测试 条 件 ， 后 面 跟 通配符 模式 。 注 意 ， 我 们 把 它 用 双 引 号 引起 来 ， 从 而 阻止 shell 展开 
路 径 名 。 紧 接着 ， 我 们 加 入 -Size 测试 条 件 ， 后 跟 字 符 串 "+1M"。 开 头 的 加 号 表明 我 们 正在 寻找 文件 大 小 大 于 指定 数 的 文件 。 
若 字 符 串 以 减 号 开头 ， 则 意味 着 查找 小 于 指定 数 的 文件 。 若 没 有 符号 意味 着 "精确 匹配 这 个 数 "。 结 尾 字母 "M" 表 明 测 量 单位 是 
兆 字 节 。 下 面 的 字符 可 以 被 用 来 指定 测量 单位 : 











Table 18-2:find 大 小 单位 


字符 单位 
b 512 个 字 节 块 。 如 果 没有 指定 单位 ， 则 这 是 默认 值 。 
C 字 节 
WwW 两 个 字 节 的 字 
k 千 字 节 (1024 个 字 节 单位 ) 
M 兆 字 节 (1048576 个 字 节 单位 ) 
G 千 兆 字 节 (1073741824 个 字 节 单位 ) 


find 命 命 支 持 大 量 不 同 的 测试 条 件 。 下 表 是 列 出 了 一 些 常见 的 测试 条 件 。 请 注意 ， 在 需要 数值 参数 的 情况 下 ， 可 以 应 用 以 上 
讨论 的 “+" 和 "-" 符 号 表示 法 : 


表 18-3: find 测试 条 件 


测试 条 件 描述 
ee 匹配 的 文件 和 目录 的 内 容 或 属性 最 后 修改 时 间 正 好 在 n 分 钟 之 前 。 指定 少 于 n 分 钟 之 
前 ， 使 用 -n， 指 定 多 于 n 分 钟 之 前 ， 使 用 +n。 
-cnewer file 匹配 的 文件 和 目录 的 内 容 或 属性 最 后 修改 时 间 早 于 那些 文件 。 
-ctime n 匹配 的 文件 和 目录 的 内 容 和 属性 最 后 修改 时 间 在 n*24 小 时 之 前 。 
-empty 匹配 空 文件 和 目录 。 
-group name 匹配 的 文件 和 目录 属于 一 个 组 。 组 可 以 用 组 名 或 组 ID 来 表示 。 


-iname pattern 





就 像 -name 测试 条 件 ， 但 是 大 小 写 敏 感 。 


-inum n 匹配 的 文件 的 inode 号 是 n。 这 对 于 找到 某 个 特殊 inode 的 所 有 硬 链接 很 有 帮助 。 
-mmin n 匹配 的 文件 或 目录 的 内 容 被 修改 于 n 分 钟 之 前 。 
-mtime n 匹配 的 文件 或 目录 的 内 容 被 修改 于 n*24 小 时 之 前 。 


-name pattern 


用 指定 的 通配符 模式 匹配 的 文件 和 目录 。 
匹配 的 文件 和 目录 的 内 容 早 于 指定 的 文件 。 当 编写 shell 脚本 ， 做 文件 备份 时 ， 非 常 有 帮 


-newer file 助 。 每 次 你 制作 一 个 备份 ， 更 新 文件 (比如 说 日 志 ) ， 然 后 使 用 find 命令 来 决定 自从 上 
次 更 新 ， 哪 一 个 文件 已 经 更 改 了 。 

ee 匹配 的 文件 和 目录 不 属于 一 个 有 效用 户 。 这 可 以 用 来 查找 属于 删除 帐户 的 文件 或 监测 攻 
击 行为 。 

-nogroup 匹配 的 文件 和 目录 不 属于 一 个 有 效 的 组 。 

re 匹配 的 文件 和 目录 的 权限 已 经 设置 为 指定 的 mode。mode 可 以 用 八进制 或 符号 表示 


-samefile name 
-Sizen 


-type c 


法 。 

相似 于 -inum 测 斌 条件。 匹配 和 文件 name 享有 同样 inode 号 的 文件 。 
匹配 的 文件 大 小 为 n。 

匹配 的 文件 类 型 是 c。 


-Username 匹配 的 文件 或 目录 属于 某 个 用 户 。 这 个 用 户 可 以 通过 用 户 名 或 用 户 ID 来 表示 。 
This is nota complete list. The find man page has all the details. 
这 不 是 一 个 完整 的 列表 。find 命令 手册 有 更 详细 的 说 明 。 
操作 符 
即使 拥有 了 find 命令 提供 的 所 有 测试 条 件 ， 我 们 还 需要 一 个 更 好 的 方式 来 描述 测试 条 件 之 间 的 远 辑 关系 。 例 如 ， 如 果 我 们 需 
要 确定 是 否 一 个 目录 中 的 所 有 的 文件 和 子 目 录 拥 有 安全 权限 ， 怎 么 办 呢 ? 我 们 可 以 查找 权限 不 是 0600 的 文件 和 权限 不 是 


0700 的 目录 。 幸 运 地 是 ，find 命令 提供 了 一 种 方法 来 结合 测试 条 件 ， 通 过 使 用 逻辑 操作 符 来 创建 更 复杂 的 逻辑 关系 。 为 了 
表达 上 述 的 测试 条 件 ， 我 们 可 以 这 样 做 : 








[me@linuxbox ~]$ find ~ \( -type f -not -perm 0600 \) -or \( -type d -not -perm 0700 \) 


呀 ! 这 的 确 看 起 来 很 奇怪 。 这 些 是 什么 东西 ?实际 上 ， 这 些 操作 符 没有 那么 复杂 ， 一 旦 你 知道 了 它们 的 原理 。 这 里 是 操作 符 
列表 : 


表 18-4: find 命 命 的 逻辑 操作 符 
操作 符 描述 


匹配 如 果 操 作 符 两 边 的 测试 条 件 都 是 真 。 可 以 简写 为 -a。 注意 若 没有 使 用 操作 符 ， 则 默 
认 使 用 -and。 


-Or 匹配 若 操作 符 两 边 的 任 一 个 测试 条 件 为 真 。 可 以 简写 为 -0。 

-not 匹配 若 操作 符 后 面 的 测试 条 件 是 真 。 可 以 简写 为 一 个 感叹 号 (!) 。 
把 测试 条 件 和 操作 符 组 合 起 来 形成 更 大 的 表达 式 。 这 用 来 控制 逻辑 计算 的 优先 级 。 默认 
情况 下 ，find 命令 按照 从 左 到 右 的 顺序 计算 。 经 常 有 必要 重 写 默 认 的 求 值 顺序 ， 以 得 到 

0 期 望 的 结果 。 即使 没有 必要 ， 有 时 候 包括 组 合 起 来 的 字符 ， 对 提高 命令 的 可 读 性 是 很 有 
帮助 的 。 注 意 因为 圆 括 号 字符 对 于 shell 来 说 有 特殊 含义 ， 所 以 在 命令 行 中 使 用 它们 的 


时 候 ， 它 们 必须 用 引号 引起 来 ， 才 能 作为 实 参 传递 给 find 命令 。 通 常 反 斜 杠 字 符 被 用 来 
转 义 圆 括 号 字符 。 


With this list of operators in hand,lets deconstruct our find command. When viewed from the uppermost level, we see 
that our tests are arranged as two groupings separated by an -or operator: 


通过 这 张 操作 符 列表 ， 我 们 重建 find 命 合 。 从 最 外 层 看 ， 我 们 看 到 测试 条 件 被 分 为 两 组 ， 由 一 个 -or 操作 符 分 开 : 





( expression 1 ) -or ( expression 2 ) 





这 很 有 意义 ， 因 为 我 们 正在 搜索 具有 不 同 权限 集合 的 文件 和 目录 。 如 果 我 们 文件 和 目录 两 者 都 查找 ， 那 为 什么 要 用 -or 来 代 
蔡 -and 呢 ? 因为 find 命令 扫描 文件 和 目录 时 ， 会 计算 每 一 个 对 象 ， 看 看 它 是 否 匹配 指定 的 测试 条 件 。 我 们 想 要 知道 它 是 具 
有 错误 权限 的 文件 还 是 有 错误 权限 的 目录 。 它 不 可 能 同时 符合 这 两 个 条 件 。 所 以 如 果 展 开 组 合 起 来 的 表达 式 ， 我 们 能 这 样 解 
释 它 : 








(file with bad perms ) -or ( directory with bad perms ) 


下 一 个 挑战 是 怎样 来 检查 “错误 权限 ”这 个 怎样 做 呢 ? 我们 不 从 这 个 角度 做 。 我 们 将 测试 “不 是 正确 权限 ”， 因 为 我 们 知道 什么 
是 “正确 权限 "。 对 于 文件 ， 我 们 定义 正确 权限 为 0600， 目录 则 为 0711。 测 试 县 有 “不 正确 "权限 的 文件 表达 式 为 : 


-type f -and -not -perms 0600 





对 于 目录 ， 表 达 式 为 : 


-type d -and -not -perms 0700 


正如 上 述 操 作 符 列表 中 提 到 的 ， 这 个 -and 操作 符 能 够 被 安全 地 删除 ， 因 为 它 是 默认 使 用 的 操作 符 。 所 以 如 果 我 们 把 这 两 个 表 
达 式 连 起 来 ， 就 得 到 最 终 的 命令 : 


find ~ ( -type f -not -perms 0600 ) -or ( -type d -not -perms 0700 ) 


然而 ， 因 为 圆 括 号 对 于 shell 有 特殊 含义 ， 我 们 必须 转 义 它们 ， 来 阻止 shell 解释 它们 。 在 圆 括 号 字符 之 前 加 上 一 个 反 斜 杠 字 
符 来 转 义 它们 。 


逻辑 操作 符 的 另 一 个 特性 要 重点 理解 。 上 比方 说 我 们 有 两 个 由 逻辑 操作 符 分 开 的 表达 式 : 


exprl -operator expr2 


在 所 有 情况 下 ， 总 会 执行 表达 式 expr1 ; 然而 由 操作 符 来 决定 是 否 执行 表达 式 expr2。 这 里 列 出 了 它 是 怎样 工作 的 : 


表 18-5: find AND/OR 逻辑 


expr1 的 结果 操作 符 expr2 is... 
真 -and 总 要 执行 
假 -and 从 不 执行 
真 -Or 从 不 执行 
假 -Or 总 要 执行 


为 什么 这 会 发 生 呢 ? 这样 做 是 为 了 提高 性 能 。 以 -and 为 例 ， 我 们 知道 表达 式 expr1 -and expr2 不 能 为 真 ， 如 果 表 过 式 
expr1 的 结果 为 假 ， 所 以 没有 必要 执行 expr2。 同 样 地 ， 如 果 我 们 有 表达 式 expr1 -or expr2， 并 且 表 达 式 expr1 的 结果 为 

真 ， 那 么 就 没有 必要 执行 expr2， 因 为 我 们 已 经 知道 表达 式 expr1 -or expr2 为 真 。 好 ， 这 样 会 执行 快 一 些 。 为 什么 这 个 很 重 
要 ? 它 很 重要 是 因为 我 们 能 依靠 这 种 行为 来 控制 怎样 来 执行 操作 。 我 们 会 很 快 看 到 .… 





预定 义 的 操作 


让 我 们 做 一 些 工 作 吧 ! 从 find 命令 得 到 的 结果 列表 很 有 用 处， 但 是 我 们 真正 想 要 做 的 事情 是 操作 列表 中 的 某 些 条 目 。 幸 运 地 
是 ，find 命令 允许 基于 搜索 结果 来 执行 操作 。 有 许多 预定 义 的 操作 和 几 种 方式 来 应用 用 户 定 义 的 操作 。 首 先 ， 让 我 们 看 一 下 
几 个 预定 义 的 操作 : 


表 18-6: 几 个 预定 义 的 find 命令 操作 


操作 描述 
-delete 删除 当前 匹配 的 文件 。 
-ls 对 匹配 的 文件 执行 等 同 的 |s -dils 命令 。 并 将 结果 发 送 到 标准 输出 。 
-print 把 匹配 文件 的 全 路 径 名 输送 到 标准 输出 。 如 果 没 有 指定 其 它 操 作 ， 这 是 默认 操作 。 
-quit 一 旦 找到 一 个 匹配 ， 退 出 。 


和 测试 条 件 一 样 ， 还 有 更 多 的 操作 。 查 看 find 命令 手册 得 到 更 多 细节 。 在 第 一 个 例子 里 ， 我 们 这 样 做 : 


find ~ 





这 个 命令 输出 了 我 们 主 目录 中 包含 的 每 个 文件 和 子 目 录 。 它 会 输出 一 个 列表 ， 因 为 会 默认 使 用 -print 操作 ， 如 果 没 有 指定 其 
它 操 作 的 话 。 因 此 我 们 的 命令 也 可 以 这 样 表述 : 


find ~ -print 


人 


我 们 可 以 使 用 find 命 兮 
们 可 以 使 用 这 个 命令 : 


来 删除 符合 一 定 条 件 的 文件 。 例 如 ， 来 删除 扩展 名 为 “BAK"” (这 通常 用 来 指定 备份 文件 ) 的 文件 ， 我 


find ~ -type f -name *.BAK' -delete 
就 删除 它们 。 





在 这 个 例子 里 面 ， 用 户主 目录 (和 它 的 子 目录 ) 下 搜索 每 个 以 .BAK 结尾 的 文件 名 。 当 找到 后 ， 





用 -print 操作 代替 -delete， 来 确认 搜索 结 


警告 : 当 使 用 -delete 操作 时 ， 不 用 说 ， 你 应 该 格外 小 心 。 首 先 测试 一 下 命 今 ， 


o 


汀 


> 时 


在 我 们 继续 之 前 ， 让 我 们 看 一 下 逮 辑 运算 符 是 怎样 影响 操作 的 。 考 虑 以 下 命令 : 


find ~ -type f -name *.BAK' -print 
尾 的 普通 文件 (-type 有 ， 并 把 每 个 匹配 文件 的 相对 





| PP 个， 


正如 我 们 所 见 到 的 ， 这 个 命令 会 查找 每 个 文件 名 以 .BAK (-name *.BAK') 结 
路 径 名 输出 到 标准 输出 (-print)。 然 而 ， 此 命令 按 这 个 方式 执行 的 原因 ， 是 由 每 个 测试 和 操作 之 间 的 逻辑 关系 决定 的 。 记 住 ， 
我 们 也 可 以 这 样 表达 这 个 命令 ， 使 远 和 辑 关 系 更 容易 看 出 : 


径 
在 每 个 测试 和 操作 之 间 会 默认 应 用 -and 逻辑 运算 符 。 


find ~ -type f -and -name *.BAK' -and -print 


让 我 们 看 看 逻辑 运算 符 是 如 何 影 响 其 执行 的 : 


当 命令 被 充分 表达 之 后 ， 
测试 一 行为 只 有 .的 时 人 息 ， 才 被 执行 
-print 只 有 -type fand -name “BAK' 为 真 的 时 候 
-name “BAK' 只 有 -type ff 为 真 的 时 候 
-type f 总 是 被 执行 ， 因 为 它 是 与 -and 关系 中 的 第 一 个 测试 一 行为 。 
因为 测试 和 行为 之 间 的 逻辑 关系 决定 了 哪 一 个 会 被 执行 ， 我 们 知道 测试 和 行为 的 顺序 很 重要 。 例 如 ， 如 果 我 们 重新 安排 测试 
和 行为 之 间 的 顺序 ， 让 -print 行为 是 第 一 个 ， 那 么 这 个 命令 执行 起 来 会 截然 不 同 : 
find ~ -print -and -type f -and -name *.BAK' 
这 个 版 本 的 命令 会 打印 出 每 个 文件 〈-print 行为 总 是 为 真 ) ， 然 后 测试 文件 类 型 和 指定 的 文件 扩展 名 。 
用 户 定义 的 行为 
除了 预定 义 的 行为 之 外 ， 我 们 也 可 以 唤醒 随意 的 命令。 传统 方式 是 通过 -exec 行为 。 这 个 行为 像 这 样 工 作 : 
这 里 是 一 个 使 


-exec command {}; 
一 个 命令 的 名 字 ， 妖 是 当前 路 径 名 的 符号 表示 ， 分 号 是 要 求 的 界定 符 表明 命令 结束 。 


这 里 的 command 就 是 指 一 个 命 兮 
用 -exec 行为 的 例子 ， 其 作用 如 之 前 讨论 的 -delete 行为 : 


-exec rm '{} 


重 述 一 吾 ， 因 为 花 括 号 和 分 号 对 于 shell 有 特殊 含义 ， 所 以 它们 必须 被 引起 来 或 被 转 义 。 


也 有 可 能 交互 式 地 执行 一 个 用 户 定义 的 行为 。 通 过 使 用 -ok 行为 来 代替 -exec， 在 执行 每 个 指定 的 命令 之 前 ， 会 提示 用 户 : 


find ~ -type f -name 'foo*' -ok ls -| '{}"";" 
<ls.../home/me/bin/foo > ? y 

-rWxr-xr-Xx 1 me me 224 2007-10-29 18:44 /home/me/bin/foo 
<ls.../home/me/foo.txt >?y 

-rW-r--r-- 1] me me 0 2008-09-19 12:53 /home/me/foo.txt 


在 这 个 例子 里 面 ， 我 们 搜索 以 字符 串 “foo”" 开 头 的 文件 名 ， 并 且 对 每 个 匹配 的 文件 执行 ls -| 命令 。 使 用 -ok 行为 ， 会 在 |s 命 全 
执行 之 前 提示 用 户 。 


是 高 效 3 


I 


居 


当 -exec 行为 被 使 用 的 时 候 ， 若 每 次 找到 一 个 匹配 的 文件 ， 它 会 启动 一 个 新 的 指定 命令 的 实例 。 我 们 可 能 更 愿意 把 所 有 的 搜 
索 结 果 结 合 起 来 ， 再 运行 一 个 命令 的 实例 。 例 如 ， 而 不 是 像 这 样 执行 命令 : 


我 们 更 喜欢 这 样 执行 命令 : 





s -| filel file2 
这 样 就 导致 命令 只 被 执行 一 次 而 不 是 多 次 。 有 两 种 方法 可 以 这 样 做 。 传 统 方式 是 使 用 外 部 命令 xargs， 另 一 种 方法 是 ， 使 用 
find 命令 自己 的 一 个 新 功能 。 我 们 先 讨 论 第 二 种 方法 。 


通过 把 末尾 的 分 号 改 为 加 号 ， 就 激活 了 find 命令 的 一 个 功能 ， 把 搜索 结果 结合 为 一 个 参数 列表 ， 然后 执行 一 次 所 期 望 的 命 
今 。 再 看 一 下 之 前 的 例子 ， 这 个 : 


find ~ -type f -name 'foo*' -exec Is -| '{}"";" 
-rWxr-xr-Xx1 me me 224 2007-10-29 18:44 /home/me/bin/foo 
-rW-r--r-- 1] Mme me 0 2008-09-19 12:53 /home/me/foo.txt 


会 执行 ls 命令 ， 每 次 找到 一 个 匹配 的 文件 。 把 命令 改 为 : 


find ~ -typef-name 'foo*' -exec ls -| '{}'+ 
-rwxr-xr-xl me me 224 2007-10-29 18:44 /home/me/bin/foo 
-rW-r--r-- 1 Mme me 0 2008-09-19 12:53 /home/me/foo.txt 


虽然 我 们 得 到 一 样 的 结果 ， 但 是 系统 只 需要 执行 一 次 ls 命令 。 
xargs 


这 个 xargs 命 合 会 执行 一 个 有 趣 的 函数 。 它 从 标准 输入 接受 输入 ， 并 把 输入 转换 为 一 个 特定 命 全 的 参数 列表 。 对 于 我 们 的 例 
子 ， 我 们 可 以 这 样 使 用 它 : 


find ~ -type f -name 'foo\*' -print | xargs ls -| 
-rwxr-xr-xl me me 224 2007-10-29 18:44 /home/me/bin/foo 
-rW-r--r-- 1 me me 0 2008-09-19 12:53 /home/me/foo.txt 


这 里 我 们 看 到 find 命 邻 的 输出 被 管道 到 xargs 命令 ， 反 过 来 ，xargs 会 为 |s 命令 构建 参数 列表 ， 然 后 执行 |s 命 今 。 





< 
A 


注意 : 当 被 放置 到 命令 行 中 的 参数 个 数 相 当 大 时 ， 参 数 个 数 是 有 限制 的 。 有 可 能 创建 的 命令 太 长 以 至 于 shell 不 能 接受 。 当 
倒 行 超过 系统 支持 的 最 大 长 度 时 ，xargs 会 执行 带 有 最 大 参数 个 数 的 指定 命令， 然后 重复 这 个 过 程 直到 耗 尽 标准 输入 。 执 
带 


有 --show--limits 选项 的 xargs 命令 ， 来 查看 命令 行 的 最 大 值 。 


HH 


她 


了 


SN 


处 理 古 怪 的 文件 名 


类 似 于 Unix 的 系统 允许 在 文件 名 中 嵌入 空格 〈 甚 至 换行 符 ) 。 这 就 给 一 些 程序 ， 如 为 其 它 程序 构建 参数 列表 的 xargs 
程序 ， 造 成 了 问题 。 一 个 伐 入 的 空格 会 被 看 作 是 一 个 界定 符 ， 生 成 的 命令 会 把 每 个 空格 分 离 的 单词 解释 为 单独 的 参 
数 。 为 了 解决 这 个 问题 ，find 命令 和 xarg 程序 允许 可 选择 的 使 用 一 个 null 字符 作为 参数 分 隔 符 。 一 个 null 字符 被 定 
义 在 ASCll 码 中 ， 由 数字 需 来 表示 (相反 的 ， 例 如 ， 空 格 字符 在 ASCII 码 中 由 数字 32 表 示 ) 。find 命令 提供 的 -print0 
行为 ， 则 会 产生 由 null 字符 分 离 的 输出 ， 并 且 xargs 命令 有 一 个 --null 选项 ， 这 个 选项 会 接受 由 null 字符 分 离 的 输 
入 。 这 里 有 一 个 例子 : 








find ~ -iname *.jpg' -printO | xargs --nullls -| 


使 用 这 项 技术 ， 我 们 可 以 保证 所 有 文件 ， 其 至 那些 文件 名 中 包含 空格 的 文件 ， 都 能 被 正确 地 处 理 。 


返回 操练 场 
到 实际 使 用 find 命令 的 时 候 了 。 我 们 将 会 创建 一 个 操练 场 ， 来 实践 一 些 我 们 所 学 到 的 知识 。 


首先 ， 让 我 们 创建 一 个 包含 许多 子 目 录 和 文件 的 操练 场 : 


[me@linuxbox ~]$ mkdir -p playground/dir-{00{1..9},0{10..99},100} 
[me@linuxbox ~]$ touch playground/dir-{00{1..9},0{10..99},100}/file-{A..2Z} 


惊叹 于 命 今 行 的 强大 功能 ! 只 用 这 两 行 ， 我 们 就 创建 了 一 个 包含 一 百 个 子 目 录 ， 每 个 子 目录 中 包含 了 26 个 空 文件 的 操练 场 。 
试 试用 GUI 来 创建 它 ! 


我 们 用 来 创造 这 个 奇迹 的 方法 中 包含 一 个 熟悉 的 命令 (mkdir) ， 一 个 奇异 的 shell 扩展 (大 括号 ) 和 一 个 新 命 舍 ，touch。 
通过 结合 mkdir 命令 和 -p 选项 (导致 mkdir 命令 创建 指定 路 径 的 父 目 录 ) ， 以 及 大 括号 展开 ， 我 们 能 够 创建 一 百 个 目录 。 


这 个 touch 命令 通常 被 用 来 设置 或 更 新 文件 的 访问 ， 更 改 ， 和 修改 时 间 。 然 而 ， 如 果 一 个 文件 名 参数 是 一 个 不 存在 的 文件 ， 
则 会 创建 一 个 空 文件 。 


在 我 们 的 操练 场 中 ， 我 们 创建 了 一 百 个 名 为 fle-A 的 文件 实例 。 让 我 们 找到 它们 : 
[me@linuxbox ~]$ find playground -typef-name file-A' 


注意 不 同 于 ls 命令 ，find 命 邻 的 输出 结果 是 无 序 的 。 其 顺序 由 存储 设备 的 布局 决定 。 为 了 确定 实际 上 我 们 拥有 一 百 个 此 文件 
的 实例 ， 我 们 可 以 用 这 种 方式 来 确认 : 


[me@linuxbox ~]$ find playground -typef-name file-A' | wc -| 


下 一 步 ， 让 我 们 看 一 下 基于 文件 的 修改 时 间 来 查找 文件 。 当 创建 备份 文件 或 者 以 年 代 顺 序 来 组 织 文件 的 时 候 ， 这 会 很 有 帮 
助 。 为 此 ， 首 先 我 们 将 创建 一 个 参考 文件 ， 我 们 将 与 其 比较 修改 时 间 : 


[me@linuxbox ~]$ touch playground/timestamp 


这 个 创建 了 一 个 空 文件 ， 名 为 timestamp， 并 且 把 它 的 修改 时 间 设 置 为 当前 时 间 。 我 们 能 够 验证 它 通过 使 用 另 一 个 方便 的 命 
令 ，stat， 是 一 款 加 大 马力 的 ls 命令 版 本 。 这 个 stat 命令 会 展示 系统 对 某 个 文件 及 其 属性 所 知道 的 所 有 信息 : 


[me@linuxbox ~]$ stat playground/timestamp 

File: 'playground/timestamp'’ 

Size: 0 Blocks: 0 IO Block: 4096 regular empty file 
Device: 803h/2051d Inode: 14265061 Links: 1 

Access: (0644/-rw-r--r--) Uid: ( 1001/ me) Gid: ( 1001/ me) 
Access: 2008-10-08 15:15:39.000000000 -0400 

Modify: 2008-10-08 15:15:39.000000000 -0400 

Change: 2008-10-08 15:15:39.000000000 -0400 


如 果 我 们 再 次 touch 这 个 文件 ， 然 后 用 stat 命令 检测 它 ， 我 们 会 发 现 所 有 文件 的 时 间 已 经 更 新 了 。 


[me@linuxbox ~]$ touch playground/timestamp 
[me@linuxbox ~]$ stat playground/timestamp 

File: 'playground/timestamp'’ 

Size: 0 Blocks: 0 IO Block: 4096 regular empty file 
Device: 803h/2051d Inode: 14265061 Links: 1 

Access: (0644/-rw-r--r--) Uid: ( 1001/ me) Gid: ( 1001/ me) 
Access: 2008-10-08 15:23:33.000000000 -0400 

Modify: 2008-10-08 15:23:33.000000000 -0400 

Change: 2008-10-08 15:23:33.000000000 -0400 


下 一 步 ， 让 我 们 使 用 find 命令 来 更 新 一 些 操练 场 中 的 文件 : 


[me@linuxbox ~]$ find playground -type f -name file-B' -exec touch '{}'"' 


这 会 更 新 操练 场 中 所 有 名 为 fle-B 的 文件 。 接 下 来 我 们 会 使 用 find 命令 来 识别 已 更 新 的 文件 ， 通过 把 所 有 文件 与 参考 文件 
timestamp 做 比较 : 


[me@linuxbox ~]$ find playground -type f -newer playground/timestamp 


搜索 结果 包含 所 有 一 百 个 文件 file-B 的 实例 。 因 为 我 们 在 更 新 了 文件 timestamp 之 后 ， touch 了 操练 场 中 名 为 fle-B 的 所 有 
文件 ， 所 以 现在 它们 "新 于 "timestamp 文件 ， 因 此 能 被 用 -newer 测试 条 件 识别 出 来 。 


最 后 ， 让 我 们 回 到 之 前 那个 错误 权限 的 例子 中 ， 把 它 应 用 于 操练 场 里 : 


[me@linuxbox ~]$ find playground \( -type f -not -perm 0600 \) -or \( -type d -not -perm 0700 \) 





这 个 命令 列 出 了 操练 场 中 所 有 一 百 个 目录 和 二 百 六 十 个 文件 〈 还 有 timestamp 和 操练 场 本 身 ， 共 2702 个 ) ， 因 为 没有 一 个 
符合 我 们 “正确 权限 "的 定义 。 通 过 对 运算 符 和 行为 知识 的 了 解 ， 我 们 可 以 给 这 个 命令 添加 行为 ， 对 实战 场 中 的 文件 和 目录 应 
用 新 的 权限 。 


[me@linuxbox ~]$ find playground \( -type f -not -perm 0600 -exec chmod 0600 '{}'';'\) 
-Or \( -type d -not -perm 0711 -exec chmod 0700 '{}'';"'\) 


在 日 常 的 基础 上 ， 我 们 可 能 发 现 运行 两 个 命 
命令 ， 但 是 很 高 兴 知 道 ， 我 们 能 这 样 执行 命 
的 任务 。 


会 比较 容易 一 些 ， 一 个 操作 目录 ， 另 一 个 操作 文件 ， 而 不 是 这 一 个 长 长 的 复合 
。 这 里 最 重要 的 一 点 是 要 理解 怎样 把 操作 符 和 行为 结合 起 来 使 用 ， 来 执行 有 用 


中 让 


选项 


最 后 ， 我 们 有 这 些 选项 。 这 些 选项 被 用 来 控制 fnd 命令 的 搜索 范围 。 当 构建 find 表达 式 的 时 候 ， 


它们 可 能 被 其 它 的 测试 条 件 
和 行为 包含 : 
表 18-7:find 命令 选项 
选项 描述 
本 指导 find 程序 先 处 理 目录 中 的 文件 ， 再 处 理 目 录 自 身 。 当 指定 -delete 行为 时 ， 会 自动 
Pp 应 用 这 个 选项 。 
-maxdepth levels 当 执 行 ; 


测试 条 件 和 行为 的 时 候 ， 设 置 find 程序 陷入 目录 树 的 最 大 级 别 数 
-mindepth levels 在 应 用 测试 条 件 和 行为 之 前 ， 设 置 find 程序 陷入 目录 数 的 最 小 级 别 数 。 


-mount 指导 find 程序 不 要 搜索 挂 载 到 其 它 文 件 系 统 上 的 目录 。 
-noleaf 指导 find 程序 不 要 基于 搜索 类 似 于 Unix 的 文件 系统 做 出 的 假设 ， 来 优化 它 的 搜索 。 
拓展 阅读 


e 程序 locate，updatedb，find 和 xargs 都 是 GNU 项 目 findutils 软件 包 的 一 部 分 。 这 个 GUN 项 目 提供 了 大 量 的 在 线 文 
档 ， 这 些 文档 相当 出 色 ， 如 果 你 在 高 安全 性 的 环境 中 使 用 这 些 程序 ， 你 应 该 读 读 这 些 文档 。 


http:/www.gnu.org/software/findutils/ 


layout book-zh 


title: 轨 档 和 名 份 


计算 机 系统 管理 员 的 一 个 主要 任务 就 是 保护 系统 的 数据 安全 。 一 种 方法 是 通过 时 时 备份 系统 文件 ， 来 保护 数据 。 即 使 你 不 是 
一 名 系统 管理 员 ， 复 制 东西 ， 在 各 个 位 置 和 设备 之 间 移 动 大 量 的 文件 ， 也 是 很 有 帮助 的 。 在 这 一 章 中 ， 我 们 将 会 看 看 几 个 经 
常用 来 管理 文件 集合 的 程序 。 它 们 就 是 文件 压缩 程序 : 


e。 gzip - 压缩 或 者 展开 文件 
e bzip2 -- 块 排序 文件 压缩 器 
归档 程序 : 

e tar 一 人 磁带 打包 工具 

e zip - 打包 和 压缩 文件 

还 有 文件 同步 程序 : 


e rsync-- 同步 远 端 文 件 和 目录 


压缩 文件 


纵 观 计算 领域 的 发 展 历史 ， 人 们 努力 想 把 最 多 的 数据 存放 到 到 最 小 的 可 用 空间 中 ， 不 管 是 内 存 ， 存 储 设备 还 是 网 络 带 宽 。 今 
天 我 们 把 许多 数据 服务 都 看 作 是 理所当然 的 事情 ， 但 是 诸如 便携 式 音乐 播放 器 ， 高 清 电视 ， 或 宽带 网 络 之 类 的 存在 都 应 为 功 
于 高 效 的 数据 压缩 技术 。 


数据 压缩 就 是 一 个 删除 郊 余 数据 的 过 程 。 让 我 们 考虑 一 个 假想 的 例子 ， 比 方 说 我 们 有 一 张 100*100 像 素 的 纯 黑 的 图 片 文件 。 
根据 数据 存储 方案 (假定 每 个 像素 占 24 位 ， 或 者 3 个 字 节 ) ， 那 么 这 张 图 像 将 会 占用 30,000 个 字 节 的 存储 空间 : 


TOO L003 = 30:000 


一 张 单 色 图 像 包含 的 数据 全 是 多 余 的 。 我 们 要 是 聪明 的 话 ， 可 以 用 这 种 方法 来 编码 这 些 数据 ， 我 们 只 要 简单 地 描述 这 个 事 
实 ， 我 们 有 3 万 个 黑色 的 像素 数据 块 。 所 以 ， 我 们 不 存储 包含 3 万 个 0 (通常 在 图 像 文件 中 ， 黑 色 由 0 来 表示 ) 的 数据 块 ， 取 而 
代 之 ， 我 们 把 这 些 数据 压缩 为 数字 30,000， 后 跟 一 个 0， 来 表示 我 们 的 数据 。 这 种 数据 压缩 方案 被 称 为 游程 编码 ， 是 一 种 最 
基本 的 压缩 技术 。 


压缩 算法 (数学 技巧 被 用 来 执行 压缩 任务 ) 分 为 两 大 类 ， 无 损 压 缩 和 有 损 压 缩 。 无 损 压 缩 保 留 了 原始 文件 的 所 有 数据 。 这 意 
味 着 ， 当 还 原 一 个 压缩 文件 的 时 候 ， 还 原 的 文件 与 原文 件 一 模 一 样 。 而 另 一 方面 ， 有 损 压 缩 ， 执 行 压缩 操作 时 会 删除 数据 ， 
允许 更 大 的 压缩 。 当 一 个 有 损 文 件 被 还 原 的 时 候 ， 它 与 原文 件 不 相 匹 配 ; 相反 ， 它 是 一 个 近似 值 。 有 损 压缩 的 例子 有 

JPEG (图 像 ) 文件 和 MP3 (音频 ) 文件 。 在 我 们 的 讨论 中 ， 我 们 将 看 看 完全 无 损 压 缩 ， 因 为 计算 机 中 的 大 多 数 数据 是 不 能 
容忍 丢失 任何 数据 的 。 


这 个 gzip 程序 被 用 来 压缩 一 个 或 多 个 文件 。 当 执行 gzip 命令 时 ， 则 原始 文件 的 压缩 版 会 蔡 代 原始 文件 。 相对 应 的 gunzip 
程序 被 用 来 把 压缩 文件 复原 为 没有 被 压缩 的 版 本 。 这 里 有 个 例子 : 


[me@linuxbox ~]$ ls -| /etc > foo.txt 

[me@linuxbox ~]$ Is -| foo.* 

-rW-r--r-- 1 me me 15738 2008-10-14 07:15 foo.txt 
[me@linuxbox ~]$ gzip foo.txt 

[me@linuxbox ~]$ |s -| foo.* 

-rwW-r--r-- 1 me me 3230 2008-10-14 07:15 foo.txt.gz 
[me@linuxbox ~]$ gunzip foo.txt 

[me@linuxbox ~]$ 1s -| foo.* 

-rW-r--r-- 1 me me 15738 2008-10-14 07:15 foo.txt 


在 这 个 例子 里 ， 我 们 创建 了 一 个 名 为 foo.txt 的 文本 文件 ， 其 内 容 包含 一 个 目录 的 列表 清单 。 接 下 来 ， 我 们 运行 gzip 命令 ， 
它 会 把 原始 文件 替换 为 一 个 叫做 foo.txt.gz 的 压缩 文件 。 在 foo.* 文 件 列表 中 ， 我 们 看 到 原始 文件 已 经 被 压缩 文件 蔡 代 了 ， 并 
将 这 个 压缩 文件 大 约 是 原始 文件 的 十 五 分 之 一 。 我 们 也 能 看 到 压缩 文件 与 原始 文件 有 着 相同 的 权限 和 时 间 惟 。 


接 下 来 ， 我 们 运行 gunzip 程序 来 解压 缩 文 件 。 随 后 ， 我 们 能 见 到 压缩 文件 已 经 被 原始 文件 替代 了 ， 同样 地 保留 了 相同 的 权 
限 和 时 间 惟 。 


gzip 命 合 有 许多 选项 。 这 里 列 出 了 一 些 : 
表 19-1: gzip 选项 
选项 说 明 


把 输出 宇和 到 标准 输出 ， 并 且 保 留 原始 文件 。 也 有 可 能 用 --stdout 和 --to-stdout 选项 来 指 
次 本 


本 解压 缩 。 正 如 gunzip 命令 一 样 。 也 可 以 用 --decompress 或 者 --uncompress 选项 来 指 


吓 ， 
f 强制 压缩 ， 即 使 原始 文件 的 压缩 文件 已 经 存在 了 ， 也 要 执行 。 也 可 以 用 --force 选项 来 指 
定 。 
-h 显示 用 法 信息 。 也 可 用 --help 选项 来 指定 。 


-| 列 出 每 个 被 压缩 文件 的 压缩 数据 。 也 可 用 --list 选项 。 


若 命令 的 一 个 或 多 个 参数 是 目录 ， 则 递归 地 压缩 目录 中 的 文件 。 也 可 用 --recursive 选项 
来 指定 。 


-t 测试 压缩 文件 的 完整 性 。 也 可 用 --test 选项 来 指定 。 
-V 显示 压缩 过 程 中 的 信息 。 也 可 用 --verbose 选项 来 指定 。 


设置 压缩 指数 。number 是 一 个 在 1 〈 最 快 ， 最 小 压缩 ) 到 9 (最 慢 ， 最 大 压缩 ) 之 间 的 


ar 整数 。 数值 1 和 9 也 可 以 各 自用 --fast 和 --best 选项 来 表示 。 默 认 值 是 整数 6。 


返回 到 我 们 之 前 的 例子 中 : 


[me@linuxbox ~]$ gzip foo.txt 
[me@linuxbox ~]$ gzip -tv foo.txt.gz 
foo.txt.gz: OK 

[me@linuxbox ~]$ gzip -d foo.txt.gz 


这 里 ， 我 们 用 压缩 文件 来 替代 文件 foo.txt， 压 缩 文 件 名 为 foo.txtgz。 下 一 步 ， 我 们 测试 了 压缩 文件 的 完整 性 ， 使 用 了 -t 和 -v 


项 。 


售 


[me@linuxbox ~]$ Is -| /etc | gzip > foo.txt.gz 


这 个 命令 创建 了 一 个 目录 列表 的 压缩 文件 。 





这 个 gunzip 程序 ， 会 解压 缩 gzip 文件 ， 假 定 那些 文件 名 的 扩展 名 是 .gz， 所 以 没有 必要 指定 它 ， 只 要 指定 的 名 字 和 与 现 有 的 未 
压缩 文件 不 冲突 就 可 以 : 


[me@linuxbox ~]$ gunzip foo.txt 


如 果 我 们 的 目标 只 是 为 了 浏览 一 下 压缩 文本 文件 的 内 容 ， 我 们 可 以 这 样 做 : 





[me@linuxbox ~]$ gunzip -c foo.txt | less 


另外 ， 对 应 于 gzip 还 有 一 个 程序 ， 叫 做 zcat， 它 等 同 于 带 有 -c 选项 的 gunzip 命令 。 它 可 以 被 用 来 如 cat 命令 作用 于 gzip 
压缩 文件 : 


[me@linuxbox ~]$ zcat foo.txt.gz | less 





小 贴 士 : 还 有 一 个 zless 程序 。 它 与 上 面 的 管道 线 有 相同 的 功能 。 


这 个 bzip2 程序 ， 由 Julian Seward 开发 ， 与 gzip 程序 相似 ， 但 是 使 用 了 不 同 的 压缩 算法 ， 舍 奔 了 压缩 速度 ， 而 实现 了 更 
高 的 压缩 级 别 。 在 大 多 数 情况 下 ， 它 的 工作 模式 等 同 于 gzip。 由 bzip2 压缩 的 文件 ， 用 扩展 名 .bz2 来 表示 : 


[me@linuxbox ~]$ |s -| /etc > foo.txt 

[me@linuxbox ~]$ Is -| foo.txt 

-rw-r--r--l1me me 15738 2008-10-17 13:51 foo.txt 
[me@linuxbox ~]$ bzip2 foo.txt 

[me@linuxbox ~]$ Is -| foo.txt.bz2 

-rwW-r--r-- lme me 2792 2008-10-17 13:51 foo.txt.bz2 
[me@linuxbox ~]$ bunzip2 foo.txt.bz2 


正如 我 们 所 看 到 的 ，bzip2 程序 使 用 起 来 和 gzip 程序 一 样 。 我 们 之 前 讨论 的 gzip 程序 的 所 有 选项 (除了 -r) ，bzip2 程序 同 
样 也 支持 。 注 意 ， 然 而 ， 压 缩 级 别 选项 (-number) 对 于 bzip2 程序 来 说 ， 有 少许 不 同 的 含义 。 伴随 着 bzip2 程序 ， 有 
bunzip2 和 bzcat 程序 来 解压 缩 文件 。bzip2 文件 也 带 有 bzip2recover 程序 ， 其 会 试图 恢复 受 损 的 .bz2 文件 。 


不 要 强迫 性 压缩 








我 偶然 见 到 人 们 试图 用 高 效 的 压缩 算法 ， 来 压缩 一 个 已 经 被 压缩 过 的 文件 ， 通 过 这 样 做 : 


$ gzip picture.jpg 


不 要 这 样 。 你 可 能 只 是 在 浪费 时 间 和 空间 ! 如 果 你 再 次 压缩 已 经 压缩 过 的 文件 ， 实 际 上 你 会 得 到 一 个 更 大 的 文件 。 这 
是 因为 所 有 的 压缩 技术 都 会 涉及 一 些 开 销 ， 文 件 中 会 被 添加 描述 此 次 压缩 过 程 的 信息 。 如 果 你 试图 压缩 一 个 已 经 不 包 
含 多 余 信息 的 文件 ， 那 么 再 次 压缩 不 会 节省 空间 ， 以 抵消 额外 的 花费 。 {: .single} 









































为 档 文件 


一 个 常见 的 ， 与 文件 压缩 结合 一 块 使 用 的 文件 管理 任务 是 为 档 。 为 档 就 是 收集 许多 文件 ， 并 把 它们 捆绑 成 一 个 大 文件 的 过 
程 。 为 档 经 常 作为 系统 备份 的 一 部 分 来 使 用 。 当 把 旧 数 据 从 一 个 系统 移 到 某 种 类 型 的 长 期 存储 设备 中 时 ， 也 会 用 到 六 档 程 
序 。 





在 类 似 于 Unix 的 软件 世界 中 ， 这 个 tar 程序 是 用 来 为 档 文 件 的 经 典 工具 。 它 的 名 字 ， 是 tape archive 的 简称 ， 揭 示 了 它 的 根 
源 ， 它 是 一 款 制作 磁带 各 份 的 工具 。 而 它 仍 然 被 用 来 完成 传统 任务 ， 它 也 同样 适用 于 其 它 的 存储 设备 。 我 们 经 常 看 到 扩展 名 
为 .tar 或 者 .tgz 的 文件 ， 它 们 各 自 表示 “普通 ” 的 tar 包 和 被 gzip 程序 压缩 过 的 tar 包 。 一 个 tar 包 可 以 由 一 组 独立 的 文件 ， 一 
个 或 者 多 个 目录 ， 或 者 两 者 混合 体 组 成 。 命 邻 语 法 如 下 : 


这 里 的 mode 是 指 以 下 操作 模式 (这 里 只 展示 了 一 部 分 ， 查 看 tar 的 手册 来 得 到 完整 列表 ) 之 一 : 


表 19-2: tar 模式 


模式 说 明 
c 为 文件 入 或 目录 列表 创建 归档 文件 。 
x 抽取 为 档 文 件 。 
r 追加 具体 的 路 径 到 为 档 文 件 的 末尾 。 
t 列 出 为 档 文件 的 内 容 。 


tar 命令 使 用 了 稍微 有 点 奇怪 的 方式 来 表达 它 的 选项 ， 所 以 我 们 需要 一 些 例 子 来 展示 它 是 怎样 工作 的 。 首 先 ， 让 我 们 重新 创 
建 之 前 我 们 用 过 的 操练 场 : 


[me@linuxbox ~]$ mkdir -p playground/dir-{00{1..9},0{10..99},100} 
[me@linuxbox ~]$ touch playground/dir-{00{1..9},0{10..99},100}/file-{A-Z} 


下 一 步 ， 让 我 们 创建 整个 操练 场 的 tar 包 : 


[me@linuxbox ~]$ tar cf playground.tar playground 


这 个 命令 创建 了 一 个 名 为 playground.tar 的 tar 包 ， 其 包含 整个 playground 目录 层次 结果 。 我 们 可 以 看 到 模式 c 和 选项 
其 被 用 来 指定 这 个 tar 包 的 名 字 ， 模 式 和 选项 可 以 写 在 一 起 ， 而 且 不 需要 开头 的 短 横 线 。 注 意 ， 然 而 ， 必 须 首先 指定 模式 ， 
然后 才 是 其 它 的 选项 。 


要 想 列 出 为 档 文件 的 内 容 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ tar tf playground.tar 


为 了 得 到 更 详细 的 列表 信息 ， 我 们 可 以 添加 选项 v : 


[me@linuxbox ~]$ tar tvf playground.tar 





现在 ， 抽 取 tar 包 playground 到 一 个 新 位 置 。 我 们 先 创建 一 个 名 为 foo 的 新 目录 ， 更 改 目 录 ， 然后 抽取 tar 包 中 的 文件 : 


[me@linuxbox ~]$ mkdir foo 
[me@linuxbox ~]$ cd foo 

[me@linuxbox ~]$ tar xf ../playground.tar 
[me@linuxbox ~]$ ls 

playground 


如 果 我 们 检查 ~/foo/playground 目录 中 的 内 容 ， 会 看 到 这 个 为 档 文件 已 经 被 成 功 地 安装 了 ， 就 是 创建 了 一 个 精确 的 原始 文件 
的 副本 。 有 一 个 警告 ， 然 而 : 除非 你 是 超级 用 户 ， 要 不 然 从 兴 档 文件 中 抽取 的 文件 和 目录 的 所 有 权 由 执行 此 复原 操作 的 用 户 
所 拥有 ， 而 不 属于 原始 所 有 者 。 





tar 命令 另 一 个 有 趣 的 行为 是 它 处 理 当 档 文件 路 径 名 的 方式 。 默 认 情 况 下 ， 路 径 名 是 相对 的 ， 而 不 是 绝对 路 径 。 当 创建 归档 
文件 的 时 候 ，tar 命令 会 简单 地 删除 路 径 名 开头 的 斜 枉 。 为 了 说 明 问 题 ， 我 们 将 会 重新 创建 我 们 的 为 档 文 件 ， 这 次 指定 一 个 
绝对 路 径 : 


[me@linuxbox foo]$ cd 
[me@linuxbox ~]$ tar cf playground2.tar ~/playground 


记 住 ， 当 按 下 回 车 键 后 ，~/playground 会 展开 成 /home/me/playground， 所 以 我 们 将 会 得 到 一 个 绝对 路 径 名 。 接 下 来 ， 和 之 
前 一 样 我 们 会 抽取 为 档 文件 ， 观 察 发 生 什么 事情 : 


[me@linuxbox ~]$ cd foo 

[me@linuxbox foo]$ tar xf ../playground2.tar 
[me@linuxbox foo]$ ls 

home playground 

[me@linuxbox foo]$ ls home 

me 

[me@linuxbox foo]$ ls home/me 

playground 


这 里 我 们 看 到 当 我 们 抽取 第 二 个 为 档 文件 时 ， 它 重新 创建 了 home/me/playground 目录 ， 相对 于 我 们 当前 的 工作 目 
录 ，~/foo， 而 不 是 相对 于 root 目录 ， 作 为 带 有 绝对 路 径 名 的 案例 。 这 看 起 来 似乎 是 一 种 奇怪 的 工作 方式 ， 但 事实 上 这 种 方 
式 很 有 用 ， 因 为 这 样 就 允许 我 们 抽取 文件 到 任意 位 置 ， 而 不 是 强制 地 把 抽取 的 文件 放置 到 原始 目录 下 。 加 上 verbose (v) 选 








项 ， 重 做 这 个 练习 ， 将 会 展现 更 加 详细 的 信息 。 


让 我 们 考虑 一 个 假设 ，tar 命令 的 实际 应 用 。 假 定 我 们 想 要 复制 主 目录 及 其 内 容 到 另 一 个 系统 中 ， 并 且 有 一 个 大 容量 的 USB 
硬盘 ， 可 以 把 它 作为 传输 工具 。 在 现代 Linux 系统 中 ， 这 个 硬盘 会 被 "自动 地 ?" 挂 载 到 /media 目录 下 。 我 们 也 假定 硬盘 中 有 一 
个 名 为 BigDisk 的 逮 辑 卷 。 为 了 制作 tar 包 ， 我 们 可 以 这 样 做 : 





[me@linuxbox ~]$ sudo tar cf /media/BigDisk/home.tar /home 


tar 包 制 作 完成 之 后 ， 我 们 外 载 硬盘 ， 然 后 把 它 连接 到 第 二 个 计算 机 上 。 再 一 次 ， 此 硬 瘟 被 挂 载 到 /media/BigDisk 目录 下 。 
为 了 抽取 六 档 文 件 ， 我 们 这 样 做 : 





[me@linuxbox2 ~]$ cd/ 
[me@linuxbox2 /]$ sudo tar xf /media/BigDisk/home.tar 





值得 注意 的 一 点 是 ， 因 为 为 档 文 件 中 的 所 有 路 径 名 都 是 相对 的 ， 所 以 首先 我 们 必须 更 改 目 录 到 根 目录 下 ， 这 样 抽取 的 文件 路 
径 就 相对 于 根 目录 了 。 


当 抽 取 一 个 为 档 文 件 时 ， 有 可 能 限制 从 为 档 文 件 中 抽取 什么 内 容 。 例 如 ， 如 果 我 们 想 要 抽取 单个 文件 ， 可 以 这 样 实现 : 
tar xf archive.tar pathname 


命令 添加 末尾 的 路 径 名 ，tar 命令 就 只 会 恢复 指定 的 文件 。 可 以 指定 多 个 路 径 名 。 注 意 路 径 名 必须 是 完全 的 ， 精 准 的 
相对 路 径 名 ， 就 如 存储 在 为 档 文 件 中 的 一 样 。 当 指定 路 径 名 的 时 候 ， 通常 不 支持 通配符 ; 然而 ，GNU 版 本 的 tar 命令 (在 
Linux 发 行 版 中 最 常 出 现 ) 通过 --wildcards 选项 来 支持 通配符 。 这 个 例子 使 用 了 之 前 playground.tar 文件 : 


[me@linuxbox ~]$ cd foo 
[me@linuxbox foo]$ tar xf ../playground2.tar --wildcards nome/me/playground/dir-*/file-A' 


这 个 命令 将 只 会 抽取 匹配 特定 路 径 名 的 文件 ， 路 径 名 中 包含 了 通配符 dir-*。 


tar 命令 经 常 结合 find 命 合 一 起 来 制作 为 档 文件 。 在 这 个 例子 里 ， 我 们 将 会 使 用 find 命令 来 产生 一 个 文件 集合 ， 然 后 这 些 文 
件 被 包含 到 妇 档 文件 中 。 


[me@linuxbox ~]$ find playground -name file-A' -exec tar rf playground.tar '{} 十 





这 里 我 们 使 用 find 命令 来 匹配 playground 目录 中 所 有 名 为 fle-A 的 文件 ， 然 后 使 用 -exec 行为 ， 来 唤醒 带 有 追加 模式 (7) 
的 tar 命令， 把 匹配 的 文件 添加 到 六 档 文 件 playground.tar 里 面 。 





使 用 tar 和 find 命令 ， 来 创建 逐渐 增加 的 目录 树 或 者 整个 系统 的 备份 ， 是 个 不 错 的 方法 。 通 过 find 命令 匹配 新 于 某 个 时 间 惟 
的 文件 ， 我 们 就 能 够 创建 一 个 为 档 文件 ， 其 只 包含 新 于 上 一 个 tar 包 的 文件 ， 假定 这 个 时 间 稚 文 件 恰好 在 每 个 为 档 文件 创建 
之 后 被 更 新 了 。 


tar 命令 也 可 以 利用 标准 输出 和 输入 。 这 里 是 一 个 完整 的 例子 


[me@linuxbox foo]$ cd 
[me@linuxbox ~]$ find playground -name file-A' | tar cf - --files-from=- 
| gzip > playground.tgz 


在 这 个 例子 里 面 ， 我 们 使 用 find 程序 产生 了 一 个 匹配 文件 列表 ， 然 后 把 它们 管道 到 tar 命令 中 。 如 果 指 定 了 文件 名 “-"， 则 其 
被 看 作 是 标准 输入 或 输出 ， 正 是 所 需 (顺便 说 一 下 ， 使 用 “-" 来 表示 标准 输入 二 输出 的 惯例 ， 也 被 大 量 的 其 它 程序 使 用 ) 。 这 
个 --file-from 选项 (也 可 以 用 -T 来 指定 ) 导致 tar 命令 从 一 个 文件 而 不 是 命令 行 来 读 和 人 它 的 路 径 名 列表 。 最 后 ， 这 个 由 tar 命 
使 产生 的 为 档 文件 被 管道 到 gzip 命令 中 ， 然 后 创建 了 压缩 注 档 文件 playground.tgz。 此 .tgz 扩展 名 是 命名 由 gzip 压缩 的 tar 


文件 的 常规 扩展 名 。 有 时 候 也 会 使 用 .tar.gz 这 个 扩展 名 。 


虽然 我 们 使 用 gzip 程序 来 制作 我 们 的 压缩 汶 档 文件 ， 但 是 现在 的 GUN 版 本 的 tar 命令 ，gzip 和 bzip2 压 缩 两 者 都 直接 支 
持 ， 各 自 使 用 z 和 j 选项 。 以 我 们 之 前 的 例子 为 基础 ， 我 们 可 以 这 样 简化 它 : 


[me@linuxbox ~]$ find playground -name file-A' | tar czf playground.tgz -T- 


如 果 我 们 本 要 创建 一 个 由 bzip2 压 缩 的 当 档 文件 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ find playground -name file-A' | tar cjf playground.tbz -T- 


通过 简单 地 修改 压缩 选项 ， 把 z 改 为 j] (并且 把 输出 文件 的 扩展 名 改 为 .tbz， 来 指示 一 个 bzip2 压 缩 文 件 ) ， 就 使 bzip2 命 今 
压缩 生效 了 。 另 一 个 tar 命令 与 标准 输入 和 输出 的 有 趣 使 用 ， 涉 及 到 在 系统 之 间 经 过 网 络 传输 文件 。 假 定 我 们 有 两 台 机 器 ， 
每 台 都 运行 着 类 似 于 Unix， 且 装 各 着 tar 和 ssh 工具 的 操作 系统 。 在 这 种 情景 下 ， 我 们 可 以 把 一 个 目录 从 远 端 系统 (名 为 
remote-sys) 传输 到 我 们 的 本 地 系统 中 : 





[me@linuxbox ~]$ mkdir remote-stuff 

[me@linuxbox ~]$ cd remote-stuff 

[me@linuxbox remote-stuff]$ ssh remote-sys ‘tar cf -Documents' | tar xf - 
me@remote-sys's password: 

[me@linuxbox remote-stuff]$ 1s 

Documents 








这 里 我 们 能 够 从 远 端 系统 remote-sys 中 复制 目录 Documents 到 本 地 系统 名 为 remote-stuff 目录 中 。 我 们 怎样 做 的 呢 ? 首 
先 ， 通 过 使 用 ssh 命令 在 远 端 系统 中 启动 tar 程序 。 你 可 记得 ssh 人 允许 我 们 在 远程 联网 的 计算 机 上 执行 程序 ， 并 且 在 本 地 系 
统 中 看 到 执行 结果 一 一 远 端 系统 中 产生 的 输出 结果 被 发 送 到 本 地 系统 中 查看 。 我 们 可 以 利用 。 在 本 地 系统 中 ， 我 们 执行 tar 
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这 个 zip 程序 既是 压缩 工具 ， 也 是 一 个 打包 工具 。 这 程序 使 用 的 文件 格式 ，Windows 用 户 比 较 熟 悉 ， 因为 它 读 取 和 写 和 .zip 
文件 。 然 而 ， 在 Linux 中 gzip 是 主要 的 压缩 程序 ， 而 bzip2 则 位 居 第 二 。 


在 zip 命令 最 基本 的 使 用 中 ， 可 以 这 样 唤醒 zip 命令 : 
zip options zipfile file... 

例如 ， 制 作 一 个 playground 的 zip 版 本 的 文件 包 ， 这 样 做 : 
[me@linuxbox ~]$ zip -r playground.zip playground 


除非 我 们 包含 -r 选项 ， 要 不 然 只 有 playground 目录 (没有 任何 它 的 内 容 ) 被 存储 。 虽 然 会 自动 添加 .zip 扩展 名 ， 但 为 了 清 
晰 起 见 ， 我 们 还 是 包含 文件 扩展 名 。 


在 创建 zip 版 本 的 文件 包 时 ，zip 命令 通常 会 显示 一 系列 的 信息 : 


adding: playground/dir-020/file-Z (stored 0%) 
adding: playground/dir-020/file-Y (stored 0%) 
adding: playground/dir-020/file-X (stored 0%) 
adding: playground/dir-087/ (stored 0%) 

adding: playground/dir-087/file-S (stored 0%) 


些 信息 显示 了 添加 到 文件 包 中 每 个 文件 的 状态 。zip 命令 会 使 用 两 种 存储 方法 之 一 ， 来 添加 文件 到 文件 包 中 : 要 不 它 
“store" 没 有 压缩 的 文件 ， 正 如 这 里 所 示 ， 或 者 它 会 "deflate" 文 件 ， 执行 压缩 操作 。 在 存储 方法 之 后 显示 的 数值 表明 了 压缩 
。 因 为 我 们 的 playground 目录 只 是 包含 空 文 件 ， 没 有 对 它 的 内 容 执 行 压缩 操作 。 
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使 用 unzip 程序 ， 来 直接 抽取 一 个 zip 文件 的 内 容 。 


[me@linuxbox ~]$ cd foo 
[me@linuxbox foo]$ unzip ../playground.zip 


对 于 zip 命令 “与 tar 命令 相反 ) 要 注意 一 点 ， 就 是 如 果 指 定 了 一 个 已 经 存在 的 文件 包 ， 其 被 更 新 而 不 是 被 替代 。 这 意味 着 
会 保留 此 文件 包 ， 但 是 会 添加 新 文件 ， 同 时 替换 匹配 的 文件 。 可 以 列 出 文件 或 者 有 选择 地 从 一 个 zip 文件 包 中 抽取 文件 ， 只 
要 给 unzip 命令 指定 文件 名 : 


[me@linuxbox ~]$ unzip -| playground.zip playground/dir-87/file-Z 
Archive: ../playground.zip 
Length Date Time Name 


0 10-05-08 09:25 playground/dir-87/file-Z 


0 1 file 
[me@linuxbox ~]$ cd foo 
[me@linuxbox foo]$ unzip ./playground.zip playground/dir-87/file-Z 
Archive: ../playground.zip 
replace playground/dir-87/file-Z? [yles, [nlo, [Al]ll, [Nljone, 
[rlename:y 
extracting: playground/dir-87/file-Z 


使 用 -| 选项 ， 导 致 unzip 命令 只 是 列 出 文件 包 中 的 内 容 而 没有 抽取 文件 。 如 果 没 有 指定 文件 ， unzip 程序 将 会 列 出 文件 包 中 
的 所 有 文件 。 添 加 这 个 -v 选项 会 增加 列表 的 元 余 信息 。 注 意 当 抽 取 的 文件 与 已 经 存在 的 文件 冲突 时 ， 会 在 替代 此 文件 之 前 提 
醒 用 户 。 


像 tar 命令 一 样 ，zip 命令 能 够 利用 标准 输入 和 输出 ， 虽 然 它 的 实施 不 大 有 用 。 通 过 -@ 选 项 ， 有 可 能 把 一 系列 的 文件 名 管道 


到 zip 命 兮 。 


[me@linuxbox foo]$ cd 
[me@linuxbox ~]$ find playground -name "file-A" | zip -@ file-A.zip 


这 里 我 们 使 用 find 命令 产生 一 系列 与 "file-A" 相 匹配 的 文件 列表 ， 并 且 把 此 列表 管道 到 zip 命 舍 ， 然后 创建 包含 所 选 文件 的 文 
件 包 file-A.zip。 


zip 命令 也 支持 把 它 的 输出 写 入 到 标准 输出 ， 但 是 它 的 使 用 是 有 限 的 ， 因 为 很 少 的 程序 能 利用 输出 。 不 幸 地 是 ， 这 个 unzip 
程序 ， 不 接受 标准 输入 。 这 就 阻止 了 zip 和 unzip 一 块 使 用 ， 像 tar 命令 那样 ， 来 复制 网 络 上 的 文件 。 


然而 ，zip 命令 可 以 接受 标准 输入 ， 所 以 它 可 以 被 用 来 压缩 其 它 程序 的 输出 : 


[me@linuxbox ~]$ ls -| /etc/ | zip ls-etc.zip - 
adding: - (deflated 80%) 


在 这 个 例子 里 ， 我 们 把 Is 命令 的 输出 管道 到 zip 命令 。 像 tar 命 舍 ，zip 命令 把 末尾 的 横 杠 解释 为 “使 用 标准 输入 作为 输入 文 
件 。 





这 个 unzip 程序 允许 它 的 输出 发 送 到 标准 输出 ， 当 指定 了 -p 选项 之 后 : 
[me@linuxbox ~]$ unzip -p ls-etc.zip | less 


我 们 讨论 了 一 些 zip/unzip 可 以 完成 的 基本 操作 。 它 们 两 个 都 有 许多 选项 ， 其 增加 了 命令 的 灵活 性 ， 虽 然 一 些 选 项 只 针对 于 
特定 的 平台 。zip 和 unzip 命令 的 说 明 手 册 都 相当 不 错 ， 并 且 包 含 了 有 用 的 实例 。 然 而 ， 这 些 程序 的 主要 用 途 是 为 了 和 
Windows 系统 交换 文件 ， 而 不 是 在 Linux 系统 中 执行 压缩 和 打包 操作 ，tar 和 gzip 程序 在 Linux 系统 中 更 受 欢迎 。 


同步 文件 和 目录 





维护 系统 备份 的 常见 策略 是 保持 一 个 或 多 个 目录 与 另 一 个 本 地 系统 (通常 是 某 种 可 移动 的 存储 设备 ) 或 者 远 端 系统 中 的 目录 

(或 多 个 目录 ) 同步 。 我 们 可 能 ， 例 如 有 一 个 正在 开发 的 网 站 的 本 地 备份， 需要 时 不 时 的 与 远 端 网 络 服务 器 中 的 文件 各 份 保 
持 同 步 。 在 类 似 于 Unix 系统 的 世界 里 ， 能 完成 此 任务 且 备 受 人 们 喜爱 的 工具 是 rsync。 这 个 程序 能 同步 本 地 与 远 端的 目录 ， 
通过 使 用 rsync 远 端 更 新 协议 ， 此 协议 允许 rsync 快速 地 检测 两 个 目录 的 差异 ， 执 行 最 小 量 的 复制 来 达到 目录 间 的 同步 。 比 
起 其 它 种 类 的 复制 程序 ， 这 就 使 rsync 命令 非常 快速 和 高 效 。 








rsync 被 这 样 唤醒 : 
这 里 source 和 destination 是 下 列 选项 之 一 : 
e 一 个 本 地 文件 或 目录 
e 一 个 远 端 文件 或 目录 ， 以 [user@]hostpath 的 形式 存在 
e 一 个 远 端 rsync 服务 器 ， 由 rsyncVW[user@]host['portlpath 指定 
注意 source 和 destination 两 者 之 一 必须 是 本 地 文件 。rsync 不 支持 远 端 到 远 端的 复制 


让 我 们 试 着 对 一 些 本 地 文件 使 用 rsync 命 伟 。 首 先 ， 清 空 我们 的 foo 目录 : 


[me@linuxbox ~]$ rm -rf foo/* 





下 一 步 ， 我 们 将 同步 playground 目录 和 它 在 foo 目录 中 相对 应 的 副本 


[me@linuxbox ~]$ rsync -av playground foo 


我 们 包括 了 -a 选项 ( 递 为 和 保护 文件 属性 ) 和 -v 选项 ( 宛 余 输 出 ) ， 来 在 foo 目录 中 制作 一 个 playground 目录 的 镜像 。 当 
这 个 命令 执行 的 时 候 ， 我 们 将 会 看 到 一 系列 的 文件 和 目录 被 复制 。 在 最 后 ， 我 们 将 看 到 一 条 像 这 样 的 总 结 信 息 : 





sent 135759 bytes received 57870 bytes 387258.00 bytes/sec 
total size is 3230 speedup is 0.02 


说 明 复制 的 数量 。 如 果 我 们 再 次 运行 这 个 命令 ， 我 们 将 会 看 到 不 同 的 结果 : 


[me@linuxbox ~]$ rsync -av playgound foo 
building file list .… done 

sent 22635 bytes received 20 bytes 

total size is 3230 speedup is 0.14 
45310.00 bytes/sec 


注意 到 没有 文件 列表 。 这 是 因为 rsync 程序 检测 到 在 目录 ~/playground 和 ~/foo/playground 之 间 不 存在 差异 ， 因 此 它 不 需要 
复制 任何 数据 。 如 果 我 们 在 playground 目录 中 修改 一 个 文件 ， 然 后 再 次 运行 rsync 命令 : 





[me@linuxbox ~]$ touch playground/dir-099/file-Z 
[me@linuxbox ~]$ rsync -av playground foo 

building file list ... done 

playground/dir-099/file-Z 

sent 22685 bytes received 42 bytes 45454.00 bytes/sec 
total size is 3230 speedup is 0.14 


我 们 看 到 rsync 命令 检测 到 更 改 ， 并 且 只 是 复制 了 更 新 的 文件 。 作 为 一 个 实际 的 例子 ， 让 我 们 考虑 一 个 假想 的 外 部 硬盘 ， 之 
前 我 们 在 tar 命令 中 用 到 过 的 。 如 果 我 们 再 次 把 此 硬盘 连接 到 我 们 的 系统 中 ， 它 被 挂 载 到 /media/BigDisk 目录 下 ， 我 们 可 以 
执行 一 个 有 用 的 系统 各 份 了 ， 首 先 在 外 部 硬盘 上 创建 一 个 目录 ， 名 为 /backup， 然 后 使 用 rsync 程序 从 我 们 的 系统 中 复制 最 
重要 的 数据 到 此 外 部 硬盘 上 : 


[me@linuxbox ~]$ mkdir /media/BigDisk/backup 
[me@linuxbox ~]$ sudo rsync -av --delete /etc /home /usr/local /media/BigDisk/backup 


在 这 个 例子 里 ， 我 们 把 /etc，/home， 和 /usrlocal 目录 从 我 们 的 系统 中 复制 到 假想 的 存储 设备 中 。 我 们 包含 了 --delete 这 个 
选项 ， 来 删除 可 能 在 备份 设备 中 已 经 存在 但 却 不 再 存在 于 源 设 备 中 的 文件 ， (这 与 我 们 第 一 次 创建 各 份 无 关 ， 但 是 会 在 随后 
的 复制 操作 中 有 用 途 ) 。 挂 裁 外 部 驱动 器 ， 运 行 rsync 命令 ， 不 断 重复 这 个 过 程 ， 是 一 个 不 错 的 〈 虽 然 不 理想 ) 方式 来 保存 
少量 的 系统 备份 文件 。 当然 ， 别 名 会 对 这 个 操作 更 有 帮助 些 。 我 们 将 会 创建 一 个 别名 ， 并 把 它 添加 到 .bashrc 文件 中 ， 来 提 
供 这 个 特性 : 


alias backup='sudo rsync -av --delete /etc /home /usr/local /media/BigDisk/backup' 


现在 我 们 所 做 的 事情 就 是 连接 外 部 驱动 器 ， 然 后 运行 backup 命令 来 完成 工作 。 
在 网 络 间 使 用 rsync 命 兮 


rsync 程序 的 真正 好 处 之 一 ， 是 它 可 以 被 用 来 在 网 络 间 复 制 文 件 。 毕 竟 ，rsync 中 的 “r" 象 征 着 “remote”。 远程 复制 可 以 通过 两 
种 方法 完成 。 第 一 个 方法 要 求 另 一 个 系统 已 经 安装 了 rsync 程序 ， 还 安装 了 远程 shell 程序 ， 比 如 ssh。 比 方 说 我 们 本 地 网 
络 中 的 一 个 系统 有 大 量 可 用 的 硬盘 空间 ， 我 们 想 要 用 远程 系统 来 代替 一 个 外 部 驱动 器 ， 来 执行 文件 备份 操作 。 假 定 远程 系 统 
中 有 一 个 名 为 /backup 的 目录 ， 其 用 来 存放 我 们 传送 的 文件 ， 我 们 这 样 做 : 


[me@linuxbox ~]$ sudo rsync -av --delete --rsh=ssh /etc /home /usrlocal remote-sys:/backup 


我 们 对 命令 做 了 两 处 修改 ， 来 方便 网 络 间 文件 复制 。 首 先 ， 我 们 添加 了 --rsh=ssh 选项 ， 其 指示 rsync 使 用 ssh 程序 作为 它 的 
远程 shell。 以 这 种 方式 ， 我 们 就 能 够 使 用 一 个 ssh 加 密 通 道 ， 把 数据 安全 地 传送 到 远程 主机 中 。 其 次 ， 通 过 在 目标 路 径 名 
前 加 上 远 端 主机 的 名 字 (在 这 种 情况 下 ， 远 端 主机 名 为 remote-sys) ， 来 指定 远 端 主机 。 


rsync 可 以 被 用 来 在 网 络 间 同步 文件 的 第 二 种 方式 是 通过 使 用 rsync 服务 器 。rsync 可 以 被 配置 为 一 个 守护 进程 ， 监 听 即 将 到 
来 的 同步 请 求 。 这 样 做 经 常 是 为 了 人 允许 一 个 远程 系统 的 镜像 。 例 如 ，Red Hat 软件 中 心 为 它 的 Fedora 发 行 版 ， 维 护 着 一 个 
巨大 的 正在 开发 中 的 软件 包 的 仓库 。 对 于 软件 测试 人 员 ， 在 发 行 周 期 的 测试 阶段 ， 镜 像 这 些 软 件 集合 是 非常 有 帮助 的 。 因 为 
仓库 中 的 这 些 文件 会 频繁 地 (通常 每 天 不 止 一 次 ) 改动 ， 定 期 同步 本 地 镜像 ， 这 是 可 取 的 ， 而 不 是 大 量 地 拷贝 软件 仓库 。 这 
些 软件 库 之 一 被 维护 在 Georgia Tech ; 我 们 可 以 使 用 本 地 rsync 程序 和 它们 的 rsync 服务 器 来 镜像 它 。 


[me@linuxbox ~]$ mkdir fedora-devel 
[me@linuxbox ~]$ rsync -av -delete rsync://rsync.gtlib.gatech.edu/fedora-linux- 
core/development/i386/0s fedora-devel 


在 这 个 例子 里 ， 我 们 使 用 了 远 端 rsync 服务 器 的 URI， 其 由 协议 (rsync://) ， 远 端 主 机 名 (rsync.gtlib.gatech.edu) ， 和 软 
件 仓 库 的 路 径 名 组 成 。 


拓展 阅读 


e 在 这 里 讨论 的 所 有 命令 的 手册 文档 都 相当 清楚 明白 ， 并 且 包含 了 有 用 的 例子 。 另 外 ， GNU 版 本 的 tar 命令 有 一 个 不 错 的 
在 线 文档 。 可 以 在 下 面 链 接 处 找到 : 


http:/www.gnu.org/software/tar/manual/index.html 


layout book-zh 


title: 正则 表达 式 


接 下 来 的 几 章 中 ， 我 们 将 会 看 一 下 一 些 用 来 操作 文本 的 工具 。 正 如 我 们 所 见 到 的 ， 在 类 似 于 Unix 的 操作 系统 中 ， 比 如 Linux 
中 ， 文 本 数据 起 着 举足轻重 的 作用 。 但 是 在 我 们 能 完全 理解 这 些 工具 提供 的 所 有 功能 之 前 ， 我 们 不 得 不 先 看 看 ， 经 常 与 这 些 
工具 的 高 级 使 用 相关 联 的 一 门 技术 一 一 正则 表达 式 。 


我 们 已 经 浏览 了 许多 由 命 合 行 提供 的 功能 和 工具 ， 我 们 遇 到 了 一 些 真正 神秘 的 shell 功能 和 命 伟 ， 比 如 shell 展开 和 引用 ， 键 
盘 快捷 键 ， 和 命 邻 历史， 更 不 用 说 vi 编辑 器 了 。 正 则 表达 式 延 续 了 这 种 "传统 "， 而 且 有 可 能 (各 受 争 议 地 ) 是 其 中 最 神秘 的 
功能 。 这 并 不 是 说 花费 时 间 来 学 习 它 们 是 不 值得 的 ， 而 是 恰恰 相反 。 虽 然 它们 的 全 部 价值 可 能 不 能 立即 显现 ， 但 是 较 强 理解 
这 些 功 能 使 我 们 能 够 表演 伟人 惊奇 的 技艺 。 什 么 是 正则 表达 式 ? 








简 而 言 之 ， 正 则 表达 式 是 一 种 符号 表示 法 ， 被 用 来 识别 文本 模式 。 在 某 种 程度 上 ， 它 们 与 匹配 文件 和 路 径 名 的 shell 通配符 
比较 相似 ， 但 其 规模 更 上 庞大。 许多 命 合 行 工具 和 大 多 数 的 编程 语言 都 支持 正则 表达 式 ， 以 此 来 帮助 解决 文本 操作 问题 。 然 
而 ， 并 不 是 所 有 的 正则 表达 式 都 是 一 样 的 ， 这 就 进一步 混淆 了 事情 ; 不 同 工 具 以 及 不 同 语言 之 间 的 正则 表达 式 都 略 有 差异 。 
我 们 将 会 限定 POSIX 标准 中 描述 的 正则 表达 式 〈 其 包括 了 大 多 数 的 命令 行 工具 ) ， 供 我 们 讨论 ， 与 许多 编程 语言 (最 著名 
的 Perl 语言 ) 相反 ， 它 们 使 用 了 更 多 和 更 丰富 的 符号 集 。 


我 们 将 使 用 的 主要 程序 是 我 们 的 老 朋 友 ，grep 程序 ， 它 会 用 到 正则 表达 式 。 实 际 上 ，grep 这 个 名 字 来 自 于 短语 “global 
regular expression print*， 所 以 我 们 能 看 出 grep 程序 和 正则 表达 式 有 关联 。 本 质 上 ，grep 程序 会 在 文本 文件 中 查找 一 个 指 
定 的 正则 表达 式 ， 并 把 匹配 行 输出 到 标准 输出 。 





到 目前 为 止 ， 我 们 已 经 使 用 grep 程序 查找 了 固定 的 字符 串 ， 就 像 这 样 : 


[me@linuxbox ~]$ Is /usr/bin | grep zip 


这 个 命令 会 列 出 ， 位 于 目录 /usrWbin 中 ， 文 件 名 中 包含 子 字符 串 zip 的 所 有 文件 。 


这 个 grep 程序 以 这 样 的 方式 来 接受 选项 和 参数 : 


grep [options] regex [file...] 


这 里 的 regx 是 指 一 个 正则 表达 式 。 
这 是 一 个 常用 的 grep 选项 列表 : 


表 20-1: grep 选项 
选项 描 
-i 忽略 大 小 写 。 不 会 区 分 大 小 写字 符 。 也 可 用 --ignore-case 来 指定 。 
不 匹配 。 通 常 ，grep 程序 会 打印 包含 匹配 项 的 文本 行 。 这 个 选项 导致 grep 程序 只 会 不 包含 匹 


学 


Ee 配 项 的 文本 行 。 也 可 用 --invertmatch 来 指定 。 

肝 人 若 指定 了 -v 选项 ) ， 而 不 是 文本 行 本 身 。 也 可 用 -- 
-| 打印 包含 匹配 项 的 文件 名 ， 而 不 是 文本 行 本 身 ， 也 可 用 --files-with-matches 选项 来 指定 。 

-L 相似 于 -| 选项 ， 但 是 只 是 打印 不 包含 匹配 项 的 文件 名 。 也 可 用 --files-without-match 来 指定 。 
-n 在 每 个 匹配 行 之 前 打印 出 其 位 于 文件 中 的 相应 行 号 。 也 可 用 --line-number 选项 来 指定 。 

-h 应 用 于 多 文件 搜索 ， 不 输出 文件 名 。 也 可 用 --no-filename 选项 来 指定 。 


为 了 更 好 的 探究 grep 程序 ， 让 我 们 创建 一 些 文本 文件 来 搜寻 : 


[me@linuxbox ~]$ Ils /bin > dirlist-bin.txt 
[me@linuxbox ~]$ ls /usrbin > dirlist-usr-bin.txt 
[me@linuxbox ~]$ ls /sbin > dirlist-sbin.txt 
[me@linuxbox ~]$ Ils /usr/sbin > dirlist-usr-sbin.txt 
[me@linuxbox ~]$ ls dirlist*.txt 

dirlist-bin.txt dirlist-sbin.txt dirlist-usr-sbin.txt 
dirlist-usr-bin.txt 


我 们 能 够 对 我 们 的 文件 列表 执行 简单 的 搜索 ， 像 这 样 : 


[me@linuxbox ~]$ grep bzip dirlist*.txt 
dirlist-bin.txt:bzip2 
dirlist-bin.txt:bzip2recover 


在 这 个 例子 里 ，grep 程序 在 所 有 列 出 的 文件 中 搜索 字符 串 bzip， 然 后 找到 两 个 匹配 项 ， 其 都 在 文件 dirlist-bin.txt 中 。 如 果 
我 们 只 是 对 包含 匹配 项 的 文件 列表 ， 而 不 是 对 匹配 项 本 身 感 兴趣 的 洛 ， 我 们 可 以 指定 -| 选项 : 


[me@linuxbox ~]$ grep -| bzip dirlist*.txt 
dirlist-bin.txt 


相反 地 ， 如 果 我 们 只 想 查 看 不 包含 匹配 项 的 文件 列表 ， 我 们 可 以 这 样 操作 : 


[me@linuxbox ~]$ grep -L bzip dirlist*.txt 
dirlist-sbin.txt 

dirlist-usr-bin.txt 

dirlist-usr-sbin.txt 


它 可 能 看 起 来 不 明显 ， 但 是 我 们 的 grep 程序 一 直 使 用 了 正则 表达 式 ， 虽 然 是 非常 简单 的 例子 。 这 个 正则 表达 式 bzip 意味 
着 ， 匹 配 项 所 在 行 至 少 包含 4 个 字符 ， 并 且 按 照 字 符 b, z, i, 和 p 的 顺序 出 现在 匹配 行 的 某 处 ， 字 符 之 间 没 有 其 它 的 字符 。 字 
符 串 bzip 中 的 所 有 字符 都 是 原 义 字符 ， 因 为 它们 匹配 本 身 。 除 了 原 义 字符 之 外 ， 正 则 表达 式 也 可 能 包含 元 字符 ， 其 被 用 来 
指定 更 复杂 的 匹配 项 。 正则 表达 式 元 字符 由 以 下 字符 组 成 : 


eS [el] 0 


然后 其 它 所 有 字符 都 被 认为 是 原 义 字符 ， 虽 然 在 个 别 情况 下 ， 反 斜 杠 会 被 用 来 创建 元 序列 ， 也 人 允许 元 字符 被 转 义 为 原 义 字 
符 ， 而 不 是 被 解释 为 元 字符 。 


意 : 正如 我 们 所 见 到 的 ， 当 shell 执行 展开 的 时 候 ， 许 多 正则 表达 式 元 字符 ， 也 是 对 shell 有 特殊 含义 的 字符 。 当 我 们 在 命 
行 中 传递 包含 元 字符 的 正则 表达 式 的 时 候 ， 把 元 字符 用 引号 引起 来 至 关 重 要 ， 这 样 可 以 阻止 shell 试图 展开 它们 。 


注 
ws 
个 


我 们 将 要 查看 的 第 一 个 元 字符 是 圆 点 字符 ， 其 被 用 来 匹配 任意 字符 。 如 果 我 们 在 正则 表达 式 中 包含 它 ， 它 将 会 匹配 在 此 位 置 
的 任意 一 个 字符 。 这 里 有 个 例子 : 


[me@linuxbox ~]$ grep -h '.zip' dirlist*.txt 
bunzip2 
bzip2 
bzip2recover 
gunzip 

gzip 

funzip 
gpg-zip 
preunzip 
prezip 
prezip-bin 
unzip 
unzipsfx 


我 们 在 文件 中 查找 包含 正则 表达 式 .zip 的 文本 行 。 对 于 搜索 结果 ， 有 几 点 需要 注意 一 下 。 注意 没有 找到 这 个 zip 程序 。 这 是 
因为 在 我 们 的 正则 表达 式 中 包含 的 圆 点 字符 把 所 要 求 的 匹配 项 的 长 度 增加 到 四 个 字符 ， 并 且 字 符 串 zip 只 包含 三 个 字符 ， 所 
以 这 个 zip 程序 不 匹配 。 另 外 ， 如 果 我 们 的 文件 列表 中 有 一 些 文件 的 扩展 名 是 .zip， 则 它们 也 会 成 为 匹配 项 ， 因 为 文件 扩展 


名 中 的 圆 点 符号 也 会 被 看 作 是 “任意 字符 "。 


在 正则 表达 式 中， 插入 符号 和 美元 符号 被 看 作 是 锚 (定位 点 ) 。 这 意味 着 正则 表达 式 只 有 在 文本 行 的 开头 或 末尾 被 找到 时 


才 算 发 生 一 次 匹配 。 


[me@linuxbox ~]$ grep -h ' 人 zip' dirlist*.txt 
zip 

zipcloak 

zipgrep 

zipinfo 

zipnote 

zipsplit 

[me@linuxbox ~]$ grep -h 'zip$' dirlist*.txt 
gunzip 

gzip 

funzip 

gpg-zip 

preunzip 

prezip 

unzip 

zip 

[me@linuxbox ~]$ grep -h ' 人 zip$' dirlist*.txt 
zip 





这 里 我 们 分 别 在 文件 列表 中 搜索 行 首 ， 行 尾 以 及 行 首 和 行 尾 同时 包含 字符 串 zip (例如 ，zip 独占 一 行 ) 的 匹配 行 。 注意 正则 


表达 式 ^$'( 行 首 和 行 尾 之 间 没 有 字符 ) 会 匹配 空 行 。 


字迹 助手 


到 目前 为 止 ， 其 至 凭借 我 们 有 限 的 正则 表达 式 知 识 ， 我 们 已 经 能 做 些 有 意义 的 对 





我 妻子 喜欢 玩 字 迷 游戏 ， 有 时 候 她 会 因为 一 个 特殊 的 问题 ， 而 向 我 求助 。 类 似 这 祥 
它 的 第 三 个 字母 是 路， 最 后 一 个 字母 是 ""， 是 哪个 单词 ?" 这 类 问题 会 让 我 动 朋 














有 情 了。 


的 问题 , “一 个 有 五 个 字母 的 单词 ， 


广 林 目 林 目 


力 /Ww o 





你 知道 你 的 Linux 系统 中 带 有 一 本 英文 字典 吗 ?和 干 真 万 确 。 看 一 下 /usr/share/dict 目录 ， 你 就 能 找到 一 本 ， 或 几 本 。 
存储 在 此 目录 下 的 字典 文件 ， 其 内 容 仅仅 是 一 个 长 长 的 单词 列表 ， 每 行 一 个 单词 ， 按 照 字母 顺序 排列 。 在 我 的 系统 
中 ， 这 个 文件 仅 包含 98,000 个 单词 。 为 了 找到 可 能 的 上 述 字 这 的 答案 ， 我 们 可 以 这 样 做 : 





[me@linuxbox ~]$ grep -i '~..j.r$' /usr/share/dict/words 


Major 
major 








使 用 这 个 正则 表达 式 ， 我 们 能 在 我 们 的 字典 文件 中 查找 到 包含 五 个 字母 ， 且 第 三 个 字母 是 ?"， 最 后 一 个 字母 是 “的 所 


有 单词 。 {: .single} 


中 括号 表达 式 和 字符 类 


除了 能 够 在 正则 表达 式 中 的 给 定位 置 匹 配 任意 字符 之 外 ， 通 过 使 用 中 括号 表达 式 ， 我 们 也 能 够 从 一 个 指定 的 字符 集合 中 匹配 
一 个 单个 的 字符 。 通 过 中 括号 表达 式 ， 我 们 能 够 指定 一 个 字符 集合 (包含 在 不 加 中 括号 的 情况 下 会 被 解释 为 元 字符 的 字符 ) 
来 被 匹配 。 在 这 个 例子 里 ， 使 用 了 一 个 两 个 字符 的 集合 : 


[me@linuxbox ~]$ grep -h '[bg]zip' dirlist*.txt 
bzip2 

bzip2recover 

gzip 


我 们 匹配 包含 字符 串 “bzip? 或 者 "gzip” 的 任意 行 。 


一 个 字符 集合 可 能 包含 任意 多 个 字符 ， 并 且 元 字符 被 放置 到 中 括号 里 面 后 会 失去 了 它们 的 特殊 含义 。 然而 ， 在 两 种 情况 下 ， 
会 在 中 括号 表达 式 中 使 用 元 字符 ， 并 且 有 着 不 同 的 含义 。 第 一 个 元 字符 是 插入 字符 ， 其 被 用 来 表示 否定 ; 第 二 个 是 连 字 符 字 
符 ， 其 被 用 来 表示 一 个 字符 区 域 。 


如 果 在 正则 表示 式 中 的 第 一 个 字符 是 一 个 插入 字符 ， 则 剩余 的 字符 被 看 作 是 不 会 在 给 定 的 字符 位 置 出 现 的 字符 集合 。 通 过 修 
改 之 前 的 例子 ， 我 们 试验 一 下 : 


[me@linuxbox ~]$ grep -h '[~^bg]zip' dirlist*.txt 
bunzip2 

gunzip 

funzip 

gpg-zip 

preunzip 

prezip 

prezip-bin 

unzip 

unzipsfx 


通过 激活 否定 操作 ， 我 们 得 到 一 个 文件 列表 ， 它 们 的 文件 名 都 包含 字符 串 zip， 并 且 zip 的 前 一 个 字符 是 除了 b 和 g 之 外 的 
任意 字符 。 注 意 文件 zip 没有 被 发 现 。 一 个 否定 的 字符 集 仍然 在 给 定位 置 要 求 一 个 字符 ， 但 是 这 个 字符 必须 不 是 否定 字符 集 
的 成 员 。 


这 个 插入 字符 如 果 是 中 括号 表达 式 中 的 第 一 个 字符 的 时 候 ， 才 会 唤醒 否定 功能 ; 否则 ， 它 会 失去 它 的 特殊 含义 ， 变 成 字符 集 
中 的 一 个 普通 字符 。 


传统 的 字符 区 域 


如 果 我 们 想 要 构建 一 个 正则 表达 式 ， 它 可 以 在 我 们 的 列表 中 找到 每 个 以 大 写字 母 开头 的 文件 ， 我 们 可 以 这 样 做 : 
[me@linuxbox ~]$ grep -h '~[ABCDEFGHIJKLMNOPQRSTUVWXZY]' dirlist*.txt 
这 只 是 一 个 在 正则 表达 式 中 输入 26 个 大 写字 母 的 问题 。 但 是 输入 所 有 字母 非常 舍 人 烦恼 ， 所 以 有 另外 一 种 方式 : 


[me@linuxbox ~]$ grep -h '~^[A-Z]' dirlist*.txt 
MAKEDEV 

ControlPanel 

GE 

HEAD 

Ps 和 

X 

X11 

Xorg 

MAKEFLOPPIES 
NetworkManager 
NetworkManagerDispatcher 


通过 使 用 一 个 三 字符 区 域 ， 我 们 能 够 缩写 26 个 字母 。 任 意 字符 的 区 域 都 能 按照 这 种 方式 表达 ， 包 括 多 个 区 域 ， 比如 下 面 这 个 
表达 式 就 匹配 了 所 有 以 字母 和 数字 开头 的 文件 名 : 


[me@linuxbox ~]$ grep -h '~^[A-Za-z0-9]' dirlist*.txt 


在 字符 区 域 中 ， 我 们 看 到 这 个 连 字符 被 特殊 对 待 ， 所 以 我 们 怎样 在 一 个 正则 表达 式 中 包含 一 个 连 字符 呢 ? 方法 就 是 使 连 字符 
成 为 表达 式 中 的 第 一 个 字符 。 考 虑 一 下 这 两 个 例子 : 


[me@linuxbox ~]$ grep -h '[A-Z]' dirlist*.txt 


这 会 匹配 包含 一 个 大 写字 母 的 文件 名 。 然 而 : 


[me@linuxbox ~]$ grep -h '[-AZ]' dirlist*.txt 


上 面 的 表达 式 会 匹配 包含 一 个 连 字 符 ， 或 一 个 大 写字 母 ‘A"， 或 一 个 大 写字 母 *Z" 的 文件 名 。 


POSIX 字符 集 


这 个 传统 的 字符 区 域 在 处 理 快速 地 指定 字符 集合 的 问题 方面 ， 是 一 个 易于 理解 的 和 有 效 的 方式 。 不 幸 地 是 ， 它 们 不 总 是 工 
作 。 到 目前 为 止 ， 虽然 我 们 在 使 用 grep 程序 的 时 候 没 有 遇 到 任何 问题 ， 但 是 我 们 可 能 在 使 用 其 它 程序 的 时 候 会 遭遇 困难 。 





回 到 第 5 章 ， 我 们 看 看 通配符 怎样 被 用 来 完成 路 径 名 展开 操作 。 在 那 次 讨论 中 ， 我 们 说 过 在 某 种 程度 上 ， 那 个 字符 区 域 被 使 
用 的 方式 几乎 与 在 正则 表达 式 中 的 用 法 一 样 ， 但 是 有 一 个 问题 : 


[me@linuxbox ~]$ ls /usr/sbin/[ABCDEFGHIJKLMNOPQRSTUVWXYZ]* 
/usr/sbin/MAKEFLOPPIES 

/usr/sbin/NetworkManagerDispatcher 

/usr/sbin/NetworkManager 


(依赖 于 不 同 的 Linux 发 行 版 ， 我 们 将 得 到 不 同 的 文件 列表 ， 有 可 能 是 一 个 空 列 表 。 这 个 例子 来 自 于 Ubuntu) 这 个 命 邻 产 
生 了 期 望 的 结果 一 一 只 有 以 大 写字 母 开头 的 文件 名 ， 但 是 : 





[me@linuxbox ~]$ ls /usr/sbin/[A-Z]* 
/usr/sbin/biosdecode 

/usr/sbin/chat 

/usr/sbin/chgpasswd 
/usr/sbin/chpasswd 

/usr/sbin/chroot 
/usr/sbin/cleanup-info 
/usr/sbin/complain 
/usr/sbin/console-kit-daemon 


通过 这 个 命令 我 们 得 到 整个 不 同 的 结果 (只 显示 了 一 部 分 结果 列表 ) 。 为 什么 会 是 那样 ? 说 来 话 长 ， 但 是 这 个 版 本 比较 简 
短 : 

追溯 到 Unix 刚刚 开发 的 时 候 ， 它 只 知道 ASCIl 字符 ， 并 且 这 个 特性 反映 了 事实 。 在 ASCIl 中 ， 前 32 个 字符 ” (数字 0 一 31) 
都 是 控制 码 (如 tabs，backspaces， 和 回 车 ) 。 随 后 的 32 个 字符 (32 一 63) 包含 可 打印 的 字符 ， 包括 大 多 数 的 标点 符号 和 


数字 0 到 9。 再 随后 的 32 个 字符 (64 一 95) 包含 大 写字 符 和 一 些 更 多 的 标点 符号 。 最 后 的 31 个 字符 (96 一 127) 包含 小 写字 
母 和 更 多 的 标点 符号 。 基 于 这 种 安排 方式 ， 系 统 使 用 这 种 排序 规则 的 ASCII : 


ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklImnopqrstuvwxyz 


这 个 不 同 于 正常 的 字典 顺序 ， 其 像 这 样 : 


aAbBcCdDeEfFgGhHiljjkKILm MnNoOpPqQrRsStTuUvVwWxXyYzZ 


随 着 Unix 系统 的 知名 度 在 美国 之 外 的 国家 传播 开 来 ， 就 需要 支持 不 在 U.S. 英 语 范围 内 的 字符 。 于 是 就 扩展 了 这 个 ASCI 字 
符 表 ， 使 用 了 整个 8 位 ， 添 加 了 字符 (数字 128 一 255) ， 这 样 就 容纳 了 更 多 的 语言 。 


为 了 支持 这 种 能 力 ，POSIX 标准 介绍 了 一 种 叫做 locale 的 概念 ， 其 可 以 被 调整 ， 来 为 某 个 特殊 的 区 域 ， 选择 所 需 的 字符 
集 。 通 过 使 用 下 面 这 个 命令 ， 我 们 能 够 查看 到 我 们 系统 的 语言 设置 : 


[me@linuxbox ~]$ echo $LANG 
en_US.UTF-8 


通过 这 个 设置 ，POSIX 相 容 的 应 用 程序 将 会 使 用 字典 排列 顺序 而 不 是 ASCII 顺序 。 这 就 解释 了 上 述 命令 的 行为 。 当 [A- 习 ] 字 
符 区 域 按照 字典 顺序 解释 的 时 候 ， 包 含 除 了 小 写字 母 a 之 外 的 所 有 字母 ， 因 此 得 到 这 样 的 结果 。 
为 了 部 分 地 解决 这 个 问题 ，POSIX 标准 包含 了 大 量 的 字符 集 ， 其 提供 了 有 用 的 字符 区 域 。 下 表 中 描述 了 它们 : 


表 20-2: POSIX 字符 集 


字符 集 说 明 
[alnum:] 字母 数字 字符 。 在 ASCll 中 ， 等 价 于 : [A-Za-z0-9] 
[word:] 与 Calnum:] 相 同 , 但 增加 了 下 划 线 字符 。 
[alpha:] 字母 字符 。 在 ASCII 中 ， 等 价 于 : [A-Za-z] 
[blank:] 包含 空格 和 tab 字符 。 
[cntrl:] ASCII 的 控制 码 。 包 含 了 0 到 31， 和 127 的 ASCII 字符 。 
[digit:] 数字 0 到 9 
[graph:] 可 视 字 符 。 在 ASCI 中 ， 它 包含 33 到 126 的 字符 。 
Elower:] 小 写字 母 。 
[punct] 标点 符号 字符 。 在 ASCIl 中 ， 等 价 于 : 
Eprint:] 可 打印 的 字符 。 在 [:graph:] 中 的 所 有 字符 ， 再 加 上 空格 字符 。 
本 及 本 空白 字符 ， 包括 空格 ，tab， 回 车 ， 换 行 ，vertical tab, 和 form feed. 在 ASCI 中 ， 等 价 
于 : [tnnwxf| 
[upper:] 大 写字 母 。 
[xdigit] 用 来 表示 十 六 进 制 数字 的 字符 。 在 ASCI 中 ， 等 价 于 : [0-9A-Fa-f 


甚至 通过 字符 集 ， 仍 然 没 有 便捷 的 方法 来 表达 部 分 区 域 ， 比 如 [A-M]。 


通过 使 用 字符 集 ， 我 们 重 做 上 述 的 例题 ， 看 到 一 个 改进 的 结果 : 





[me@linuxbox ~]$ Is /usr/sbin/[[:upper:]]* 
/usr/sbin/MAKEFLOPPIES 
/usr/sbin/NetworkManagerDispatcher 
/usr/sbin/NetworkManager 


记 住 ， 然 而 ， 这 不 是 一 个 正则 表达 式 的 例子 ， 而 是 shell 正在 执行 路 径 名 展开 操作 。 我 们 在 这 里 展示 这 个 例子 ， 是 因为 
POSIX 规范 的 字符 集 适 用 于 二 者 。 


恢复 到 传统 的 排列 顺序 


局 


通过 改变 环境 变量 LANG 的 值 ， 你 可 以 选择 让 你 的 系统 使 用 传统 的 《ASCII) 排列 规则 。 如 上 所 示 ， 这 个 LANG 变 
包含 了 语种 和 字符 集 。 这 个 值 最 初 由 你 安装 Linux 系统 时 所 选择 的 安装 语言 决定 。 




















使 用 locale 命令， 来 查看 locale 的 设置 。 


把 这 个 LANG 变量 设置 为 POSIX， 来 更 改 locale， 使 其 使 用 传统 的 Unix 行为 。 








注意 这 个 改动 使 系统 为 它 的 字符 集 使 用 U.S. 英语 (更 准确 地 说 ，ASCIl) ， 所 以 要 确认 一 下 这 是 否 是 你 真正 想 要 的 效 
果 。 通 过 把 这 条 语句 添加 到 你 的 .bashrc 文件 中 ， 你 可 以 使 这 个 更 改 永久 有 效 。 


POSIX 基本 的 Vs. 扩 展 的 正则 表达 式 


就 在 我 们 认为 这 已 经 非常 舍 人 困惑 了 ， 我 们 却 发 现 POSIX 把 正则 表达 式 的 实现 分 成 了 两 类 : 基本 正则 表达 式 (BRE) 和 扩 
展 的 正则 表达 式 (ERE) 。 既 服从 POSIX 规范 又 实现 了 BRE 的 任意 应 用 程序 ， 都 支持 我 们 目前 研究 的 所 有 正则 表达 式 特 
性 。 我 们 的 grep 程序 就 是 其 中 一 


BRE 和 ERE 之 间 有 什么 区 别 呢 ? 这 是 关于 元 字符 的 问题 。BRE 可 以 辨别 以 下 元 字符 : 
SS 
的 所 有 字符 被 认为 是 文本 字符 。ERE 添加 了 以 下 元 字符 (以 及 与 其 相关 的 功能 ) : 
(| 


然而 (这 也 是 有 趣 的 地 方 ) ， 在 BRE 中 ， 字 符 (，)，{， 和 } 用 反 斜 杠 转 义 后 ， 被 看 作 是 元 字符 , 相反 在 ERE 中 ， 在 任意 元 
字符 之 前 加 上 反 斜 杠 会 导致 其 被 看 作 是 一 个 文本 字符 。 在 随后 的 讨论 & 中 将 会 洒 盖 很 多 奇异 的 特性 。 


因为 我 们 将 要 讨论 的 下 一 个 特性 是 ERE 的 一 部 分 ， 我 们 将 要 使 用 一 个 不 同 的 grep 程序 。 照 惯例 ， 一 直 由 egrep 程序 来 执行 
这 项 操作 ， 但 是 GUN 版 本 的 grep 程序 也 支持 扩展 的 正则 表达 式 ， 当 使 用 了 -E 选项 之 后 。 


在 20 世纪 80 年 代 ，Unix 成 为 一 款 非常 流行 的 商业 操作 系统 ， 但 是 到 了 1988 年 ，Unix 世界 一 片 混乱 。 许 多 计算 机 制 
造 商 从 Unix 的 创建 者 AT&T 那里 得 到 了 许可 的 Unix 源码 ， 并 且 供应 各 种 版 本 的 操作 系统 。 然 而 ， 在 他 们 努力 创造 产 
品 差异 化 的 同时 ， 每 个 制造 商都 增加 了 专用 的 更 改 和 扩展 。 这 就 开始 限制 了 软件 的 兼容 性 。 





专 有 软件 供应 商 一 如 既往 ， 每 个 供应 商都 试图 玩 启 游戏 “锁定 ”他们 的 客户 。 这 个 Unix 历史 上 的 黑暗 时 代 ， 就 是 今天 众 
所 周知 的 “the Balkanization”。 





然后 进入 IEEE ( 电气 与 电子 工程 病 协 会 ) 时 代 。 在 上 世纪 80 年 代 中 叶 ，IEEE 开始 制定 一 套 标准 ， 其 将 会 定义 Unix 
系统 (以 及 类 似 于 Unix 的 系统 ) 如 何 执行 。 这 些 标准 ， 正 式 成 为 IEEE 1003， 定义 了 应 用 程序 编程 接口 ( APls 

) ，shell 和 一 些 实用 程序 ， 其 将 会 在 标准 的 类 似 于 Unix 操作 系统 中 找到 。“POSIX” 这 个 名 字 ， 象 征 着 可 移植 的 操作 
系统 接口 (为 了 额外 的 ， 添 加 末尾 的 “X” ) ， 是 由 Richard Stallman 建议 的 〈 是 的 ， 的 确 是 Richard Stallman ) ， 
后 来 被 IEEE 采纳 。 














我 们 将 要 讨论 的 扩展 表达 式 的 第 一 个 特性 叫做 alternation (交替 ) ， 其 是 一 款 允 许 从 一 系列 表达 式 之 间 选 择 匹 配 项 的 实用 程 
序 。 就 像 中 括号 表达 式 允 许 从 一 系列 指定 的 字符 之 间 匹 配 单个 字符 那样 ， alternation et 
表达 式 中 选择 匹配 项 。 为 了 说 明 问 题 ， 我 们 将 会 结合 echo 程序 来 使 用 grep 命令 。 首 先 ， 让 我 们 试 一 个 普通 的 字符 串 匹 配 : 


[me@linuxbox ~]$ echo "AAA" | grep AAA 
AAA 

[me@linuxbox ~]$ echo "BBB" | grep AAA 
[me@linuxbox ~]$ 





一 个 相当 直截了当 的 例子 ， 我 们 把 echo 的 输出 管道 给 grep， 然 后 看 到 输出 结果 。 当 出 现 一 个 匹配 项 时 ， 我 们 看 到 它 会 打印 
出 来 ; 当 没 有 匹配 项 时 ， 我 们 看 到 没有 输出 结果 。 


现在 我 们 将 添加 alternation， 以 坚 杠 线 元 字符 为 标记 : 


[me@linuxbox ~]$ echo "AAA'" | grep -E 'AAAIBBB' 
AAA 

[me@linuxbox ~]$ echo "BBB" | grep -E 'AAAIBBB' 
BBB 

[me@linuxbox ~]$ echo "CCC" | grep -E 'AAAIBBB' 
[me@linuxbox ~]$ 


这 里 我 们 看 到 正则 表达 式 'AAA|BBB'， 这 意味 着 “匹配 字符 串 AAA 或 者 是 字符 串 BBB"。 注 意 因 为 这 是 一 个 扩展 的 特性 ， 我 们 
给 grep 命令 〈 虽 然 我 们 能 以 egrep 程序 来 代替 ) 添加 了 -E 选项 ， 并 且 我 们 把 这 个 正则 表达 式 用 单 引 号 引起 来 ， 为 的 是 阻止 
shell 把 坚 杠 线 元 字符 解释 为 一 个 pipe 操作 符 。 Alternation 并 不 局 限于 两 种 选择 : 


[me@linuxbox ~]$ echo "AAA" | grep -E 'AAA|BBBI|CCC' 
AAA 


为 了 把 alternation 和 其 它 正 则 表达 式 元 素 结合 起 来 ， 我 们 可 以 使 用 () 来 分 离 alternation。 
[me@linuxbox ~]$ grep -Eh '~^ (bzlgzlzip)' dirlist*.txt 

这 个 表达 式 将 会 在 我 们 的 列表 中 匹配 以 bz， 或 gz， 或 zip 开头 的 文件 名 。 如 果 我 们 删除 了 圆 括 号 ， 这 个 表达 式 的 意思 : 
[me@linuxbox ~]$ grep -Eh '^bzlgzlzip' dirlist*.txt 


会 变 成 匹配 任意 以 bz 开头 ， 或 包含 gz， 或 包含 zip 的 文件 名 。 
限定 符 

扩展 的 正则 表达 式 支持 几 种 方法 ， 来 指定 一 个 元 素 被 匹配 的 次 数 。 
? - 匹配 一 个 元 素 雪 次 或 一 次 


这 个 限定 符 意 味 着 ， 实 际 上 , “使 前 面 的 元 素 可 有 可 无 。" 比 方 说 我 们 想 要 查看 一 个 电话 号 码 的 真实 性 ， 如 果 它 匹配 下 面 两 种 
格式 的 任意 一 种 ， 我 们 就 认为 这 个 电话 号 码 是 真实 的 : 


(nnn) nnn-nnnn 


nnn nnn-nnnn 
这 里 的 “n" 是 一 个 数字 。 我 们 可 以 构建 一 个 像 这 样 的 正则 表达 式 : 
^\?[0-9][0-9][0-9]N? [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$ 


在 这 个 表达 式 中 ， 我 们 在 圆 括 号 之 后 加 上 一 个 问号 ， 来 表示 它们 将 被 匹配 需 次 或 一 次 。 再 一 次 ， 因 为 通常 圆 括号 都 是 元 字符 
(在 ERE 中 ) ， 所 以 我 们 在 圆 括 号 之 前 加 上 了 反 斜 杠 ， 使 它们 成 为 文本 字符 。 


让 我 们 试 一 下 : 


me@linuxbox ~]$ echo "(555) 123-4567" | grep -E '~^\(?[0-9][0-9][0-9] 
\? [0-9][0-9][0-9]$" 

555) 123-4567 
me@linuxbox ~]$ echo "555 123-4567" | grep -E '~^\(?[0-9][0-9][0-9]\) 
? [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$"' 

555 123-4567 
me@linuxbox ~]$ echo "AAA 123-4567" | grep -E '~^\(?[0-9][0-9][0-91]\) 
? [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$"' 

me@linuxbox ~]$ 








这 里 我 们 看 到 这 个 表达 式 匹 配 这 个 电话 号 码 的 两 种 形式 ， 但 是 不 匹配 包含 非 数字 字符 的 号 码 。 


像 ?元 字符 一 样 ， 这 个 * 被 用 来 表示 一 个 可 选 的 字符 ; 然而 ， 又 与 ?不 同 ， 匹 配 的 字符 可 以 出 现 任意 多 次 ， 不 仅 是 一 次 。 比 方 
说 我 们 想 要 知道 是 否 一 个 字符 串 是 一 名 话 ; 也 就 是 说 ， 字 符 串 开始 于 一 个 大 写字 母 ， 然 后 包含 任意 多 个 大 写 和 小 写 的 字母 和 


空格 ， 最 后 以 句号 收尾 。 为 了 匹配 这 个 (非常 粗略 的 ) 语句 的 定义 ， 我 们 能 够 使 用 一 个 像 这 样 的 正则 表达 式 : 


[[:upper:]][[:upper:][:lower:] ]*. 


这 个 表达 式 由 三 个 元 素 组 成 : 一 个 包含 [:upper:] 字符 集 的 中 括号 表达 式 ， 一 个 包含 [:upper:] 和 [:lower:] 两 个 字符 集 以 及 一 个 
空格 的 中 括号 表达 式 ， 和 一 个 被 反 斜 杠 字符 转 义 过 的 圆 点 。 第 二 个 元 素 末尾 带 有 一 个 * 元 字符 ， 所 以 在 开头 的 大 写字 母 之 





后 ， 可 能 会 跟随 着 任意 数目 的 大 写 和 小 写字 母 和 空格 ， 并 且 匹 配 : 


[me@linuxbox ~]$ echo "This works." | grep -E '[[:upper:]][[:upper:][[:lower:]]*." 
This works. 

[me@linuxbox ~]$ echo "This Works." | grep -E '[[:upper:]][[:upper:][[:lower:]]*.' 
This Works. 

[me@linuxbox ~]$ echo "this does not" | grep -E '[[:upper:]][[:upper: J][[:lower:]]*." 
[me@linuxbox ~]$ 


这 个 表达 式 匹 配 前 两 个 测试 语句 ， 但 不 匹配 第 三 个 ， 因 为 第 三 个 句子 缺少 开头 的 大 写字 母 和 末尾 的 句号 。 


+ - 匹配 一 个 元 素 一 次 或 多 次 


这 个 + 元 字符 的 作用 与 * 非常 相似 ， 除 了 它 要 求 前 面 的 元 素 至 少 出 现 一 次 匹配 。 这 个 正则 表达 式 只 匹配 那些 由 一 个 或 多 个 


母 字符 组 构成 的 文本 行 ， 字 和 母 字符 之 间 由 单个 空格 分 开 : 


me@linuxbox ~]$ echo "This that" | grep -E '~^([[:alpha:]]+ ?) 十 $/ 
This that 

me@linuxbox ~]$ echo "ab c" | grep -E '~^([[:alpha:]]+ ?)+$" 
aibsc 

me@linuxbox ~]$ echo "ab 9" | grep -E '~^([[:alpha:]]+ ?)+$" 
me@linuxbox ~]$ echo "abc d"| grep -E '~^([[:alpha:]]+ ?)+$" 
me@linuxbox ~]$ 





Ee 


于 


我 们 看 到 这 个 正则 表达 式 不 匹配 “a b 9"” 这 一 行 ， 因 为 它 包 含 了 一 个 非 字母 的 字符 ; 它 也 不 匹配 “abc d” ， 因 为 在 字符 c 和 d 


之 间 不 止 一 个 空 


{ } - 匹配 一 个 元 素 特定 的 次 数 


{ 和 } 元 字符 都 被 用 来 表达 要 求 匹配 的 最 小 和 最 大 数目 。 它 们 可 以 通过 四 种 方法 来 指定 : 





表 20-3: 指定 匹配 的 数目 


限定 符 意思 
{n} 匹配 前 面 的 元 素 ， 如 果 它 确切 地 出 现 了 n 次 。 
{n,m} 匹配 前 面 的 元 素 ， 如 果 它 至 少 出 现 了 n 次 ， 但 是 不 多 于 m 次 。 


{n,} 匹配 前 面 的 元 素 ， 如 果 它 出 现 了 n 次 或 多 于 mn 次 。 


{,m} 匹配 前 面 的 元 素 ， 如 果 它 出 现 的 次 数 不 多 于 m 次 。 


回 到 之 前 处 理 电话 号 码 的 例子 ， 我 们 能 够 使 用 这 种 指定 重复 次 数 的 方法 来 簿 化 我 们 最 初 的 正则 表达 式 : 


~\(?[0-9][0-9][0-9]\)? [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$ 


~\(?[0-9]{3}V)? [0-9]{3}-[0-9]{4}$ 


让 我 们 试 一 下 : 


me@linuxbox ~]$ echo "(555) 123-4567" | grep -E '~^\(?[0-9]{3}\)? [0-9]{3}-[0-9]{4}$"' 
S51234567 

me@linuxbox ~]$ echo "555 123-4567" | grep -E '~^\(?[0-9]{3}\)? [0-9]{3}-[0-9] {4}$" 
555 123-4567 

me@linuxbox ~]$ echo "5555 123-4567" | grep -E '~^\(?[0-9]{3}\)? [0-9]{3}-[0-9]{4}$" 
[me@linuxbox ~]$ 





我 们 可 以 看 到 ， 我 们 修订 的 表达 式 能 成 功 地 验证 带 有 和 不 带 有 圆 括号 的 数字 ， 而 拒绝 那些 格式 不 正确 的 数字 。 


让 正则 表达 式 工作 起 来 


让 我 们 看 看 一 些 我 们 已 经 知道 的 命令， 然后 看 一 下 它们 怎样 使 用 正则 表达 式 。 
通过 grep 命令 来 验证 一 个 电话 簿 


在 我 们 先前 的 例子 中 ， 我 们 查看 过 单个 电话 号 码 ， 并 且 检 查 了 它们 的 格式 。 一 个 更 现实 的 情形 是 检查 一 个 数字 列表 ， 所 以 我 
们 先 创建 一 个 列表 。 我 们 将 背诵 一 个 神奇 的 贺 语 到 命令 行 中 。 它 会 很 神奇 ， 因 为 我 们 还 没有 酒 盖 所 涉及 的 大 部 分 命令 ， 但 是 
不 要 担心 。 我 们 将 在 后 面 的 章节 里 面 讨论 那些 命令 。 这 里 是 这 个 贺 语 : 


[me@linuxbox ~]$ fori in {1..10}; do echo "(${RANDOM:0:3}) $ {RANDO 
M:0:3}-${RANDOM:0:4}" >> phonelist.txt; done 


这 个 命令 会 创建 一 个 包含 10 个 电话 号 码 的 名 为 phonelist.txt 的 文件 。 每 次 重复 这 个 命令 的 时 候 ， 另外 10 个 号 码 会 被 添加 到 这 
个 列表 中 。 我 们 也 能 够 更 改 命令 开头 附近 的 数值 10， 来 生成 或 多 或 少 的 电话 号 码 。 如 果 我 们 查看 这 个 文件 的 内 容 ， 然 而 我 们 


会 发 现 一 个 问题 : 


[me@linuxbox ~]$ cat phonelist.txt 
232) 298-2265 
(624) 381-1078 
540) 126-1980 
874) 163-2885 
286) 254-2860 
292) 108-518 
129) 44-1379 
458) 273-1642 
686) 299-8268 
198) 307-2440 





一 些 号 码 是 残缺 不 全 的 ， 但 是 它们 很 适合 我 们 的 需求 ， 因 为 我 们 将 使 用 grep 命令 来 验证 它们 。 


一 个 有 用 的 验证 方法 是 扫描 这 个 文件 ， 查 找 无 效 的 号 码 ， 并 把 搜索 结果 显示 到 屏幕 上 : 


[me@linuxbox ~]$ grep -Ev '~^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$" 
phonelist.txt 

(292) 108-518 

(129) 44-1379 

[me@linuxbox ~]$ 


这 里 我 们 使 用 -v 选项 来 产生 相反 的 匹配 ， 因 此 我 们 将 只 输出 不 匹配 指定 表达 式 的 文本 行 。 这 个 表达 式 自身 的 两 端 都 包含 定位 
点 〈 锚 ) 元 字符 ， 是 为 了 确保 这 个 号 码 的 两 端 没 有 多 余 的 字符 。 这 个 表达 式 也 要 求 圆 括号 出 现在 一 个 有 效 的 号 码 中 ， 不 同 于 
我 们 先前 电话 号 码 的 实例 。 


用 find 查找 匡 陋 的 文件 名 


这 个 find 命令 支持 一 个 基于 正则 表达 式 的 测试 。 当 在 使 用 正则 表达 式 方 面 比较 find 和 grep 命令 的 时 候 ， 还 有 一 个 重要 问题 
要 牢记 在 心 。 当 某 一 行 包含 的 字符 串 匹 配 上 了 一 个 表达 式 的 时 候 ，grep 命令 会 打印 出 这 一 行 ， 然而 find 命令 要 求 路 径 名 精 
确 地 匹配 这 个 正则 表达 式 。 在 下 面 的 例子 里 面 ， 我 们 将 使 用 带 有 一 个 正则 表达 式 的 find 命令， 来 查找 每 个 路 径 名 ， 其 包含 的 
任意 字符 都 不 是 以 下 字符 集中 的 一 员 。 


[-\_./0-9a-zA-Z] 
这 样 一 种 扫描 会 发 现 包含 空格 和 其 它 潜在 不 规范 字符 的 路 径 名 : 
[me@linuxbox ~]$ find . -regex '.#[ 信 ./0-9a-zA-Z].*' 


由 于 要 精确 地 匹配 整个 路 径 名 ， 所 以 我 们 在 表达 式 的 两 端 使 用 了 .*， 来 匹配 零 个 或 多 个 字符 。 在 表达 式 中 间 ， 我 们 使 用 了 否 
定 的 中 括号 表达 式 ， 其 包含 了 我 们 一 系列 可 接受 的 路 径 名 字符 。 


用 locate 查找 文件 


这 个 locate 程序 支持 基本 的 〈--regexp 选项 ) 和 扩展 的 (--regex 选项 ) 正则 表达 式 。 通 过 locate 命 伟 ， 我 们 能 够 执行 许多 
与 先前 操作 dirlist 文件 时 相同 的 操作 : 


[me@linuxbox ~]$ locate --regex 'bin/(bzlgzlzip)’ 
/bin/bzcat 
/bin/bzcmp 
/bin/bzdiff 
/bin/bzegrep 
/bin/bzexe 
/bin/bzfgrep 
/bin/bzgrep 
/bin/bzip2 
/bin/bzip2recover 
/bin/bzless 
/bin/bzmore 
/bin/gzexe 
/bin/gzip 
/usr/bin/zip 
/usr/bin/zipcloak 
/usr/bin/zipgrep 
/usr/bin/zipinfo 
/usr/bin/zipnote 
/usr/bin/zipsplit 


通过 使 用 alternation， 我 们 搜索 包含 bin/bz，bin/gz， 或 /bin/zip 字符 串 的 路 径 名 。 


在 less 和 vim 中 查找 文本 


less 和 vim 两 者 享有 相同 的 文本 查找 方法 。 按 下 /按键 ， 然 后 输入 正则 表达 式 ， 来 执行 搜索 任务 。 如 果 我 们 使 用 less 程序 来 
浏览 我 们 的 phonelisttxt 文件 : 


[me@linuxbox ~]$ less phonelist.txt 


然后 查找 我 们 有 效 的 表达 式 : 


232) 298-2265 
(624) 381-1078 
540) 126-1980 
874) 163-2885 
286) 254-2860 
292) 108-518 

129) 44-1379 

458) 273-1642 
686) 299-8268 
198) 307-2440 


/~\([0-9]{3}\) [0-9]{3}-[0-9]{4}$ 





less 将 会 高 完 匹 配 到 的 字符 串 ， 这 样 就 很 容易 看 到 无 效 的 电话 号 码 : 


(232) 298-2265 
624) 381-1078 
540) 126-1980 
874) 163-2885 
286) 254-2860 
292) 108-518 

129) 44-1379 

458) 273-1642 
686) 299-8268 
198) 307-2440 


END) 








另 一 方面 ，vim 支持 基本 的 正则 表达 式 ， 所 以 我 们 用 于 搜索 的 表达 式 看 起 来 像 这 样 : 


/([0-9]\{3\}) [0-9]\{3\}-[0-9]\{4\} 


我 们 看 到 表达 式 几 乎 一样 ; 然而 ， 在 扩展 表达 式 中 ， 许 多 被 认为 是 元 字符 的 字符 在 基本 的 表达 式 中 被 看 作 是 文本 字符 。 只 有 
用 反 斜 杠 把 它们 转 义 之 后 ， 它 们 才 被 看 作 是 元 字符 。 


依赖 于 系统 中 vim 的 特殊 配置 ， 匹 配 项 将 会 被 高 之 。 如 若 不 是 ， 试 试 这 个 命 命 模 式 : 


:hlsearch 


来 激活 搜索 高 完 功 能 。 


注意 : 依赖 于 你 的 发 行 版 ，vim 有 可 能 支持 或 不 支持 文本 搜索 高 亮 功 能 。 尤 其 是 Ubuntu 自 带 了 一 款 非常 简化 的 vim 版 本 。 
在 这 样 的 系统 中 ， 你 可 能 要 使 用 你 的 软件 包 管 理 器 来 安装 一 个 功能 更 完备 的 vim 版 本 。 





在 这 章 中 ， 我 们 已 经 看 到 几 个 使 用 正则 表达 式 例 子 。 如 果 我 们 使 用 正则 表达 式 来 搜索 那些 使 用 正则 表达 式 的 应 用 程序 ， 我 们 
可 以 找到 更 多 的 使 用 实例 。 通 过 查找 手册 页 ， 我 们 就 能 找到 : 


[me@linuxbox ~]$ cd /usr/share/man/manl 
[me@linuxbox man1]$ zgrep -El 'regexlregular expression' *.gz 


这 个 zgrep 程序 是 grep 的 前 端 ， 允 许 grep 来 读 取 压缩 文件 。 在 我 们 的 例子 中 ， 我 们 在 手册 文件 所 在 的 目录 中 ， 搜 索 压 缩 文 
件 中 的 内 容 。 这 个 命令 的 结果 是 一 个 包含 字符 串 regex 或 者 regular expression 的 文件 列表 。 正 如 我 们 所 看 到 的 ， 正 则 表达 
式 会 出 现在 大 量程 序 中 。 


基本 正则 表达 式 中 有 一 个 特性 ， 我 们 没有 涵盖 。 叫 做 反 引 用 ， 这 个 特性 在 下 一 章 中 会 被 讨论 到 。 
拓展 阅读 

有 许多 在 线 学 习 正 则 表达 式 的 资源 ， 包 括 各 种 各 样 的 教材 和 速记 表 。 

另外 ， 关 于 下 面 的 背景 话题 ，Wikipedia 有 不 错 的 文章 。 

e POSIX:http://en.wikipedia.org/wiki/Posix 


e ASCIE http:/en.wWikipedia.orgwiki/Ascii 


文本 处 理 


所 有 类 似 于 Unix 的 操作 系统 都 非常 依赖 于 被 用 于 几 种 数据 类 型 存储 的 文本 文件 。 所 以 这 很 有 道理 ， 有 许多 用 于 你 理 文本 的 
工具 。 在 这 一 章 中 ， 我 们 将 看 一 些 被 用 来 "切割 "文本 的 程序 。 在 下 一 章 中 ， 我 们 将 查看 更 多 的 文本 义理 程序 ， 但 主要 集中 于 
文本 格式 化 输出 程序 和 其 它 一 些 人 们 需要 的 工具 。 

这 一 章 会 重新 拜访 一 些 老 朋 友 ， 并 且 会 给 我 们 介绍 一 些 新 朋友 : 

e。 cat 一 连接 文件 并 且 打印 到 标准 输出 

e Sort 一 给 文本 行 排序 

e。 uniq 一 报告 或 者 省 略 重复 行 

e cut 一 从 每 行 中 删除 文本 区 域 

e paste 一 合并 文件 文本 行 

e join 一 基于 某 个 共享 字段 来 联合 两 个 文件 的 文本 行 


e。 comm 一 逐 行 比较 两 个 有 序 的 文件 


diff- 逐 行 比较 文件 

。 patch - 给 原始 文件 打 补丁 

。 fr 一 翻译 或 删除 字符 

e Sed 一 用 于 第 选 和 转换 文本 的 流 编 辑 器 


aspell - 交互 式 拼写 检查 器 


文本 应 用 程序 


到 目前 为 止 ， 我们 已 经 知道 了 一 对 文本 编辑 器 (nano 和 vim) ， 看 过 一 堆 配 置 文件 ， 并 且 目 睹 了 许多 命令 的 输出 都 是 文本 
格式 。 但 是 文本 还 被 用 来 做 什么 它 可 以 做 很 多 事情 。 








许多 人 使 用 纯 文本 格式 来 编写 文档 。 虽 然 很 容易 看 到 一 个 小 的 文本 文件 对 于 保存 简单 的 笔记 会 很 有 帮助 ， 但 是 也 有 可 能 用 文 
本 格式 来 编写 大 的 文档 。 一 个 流行 的 方法 是 先 用 文本 格式 来 编写 一 个 大 的 文档 ， 然 后 使 用 一 种 标记 语言 来 描述 已 完成 文档 的 
格式 。 许 多 科学 论文 就 是 用 这 种 方法 编写 的 ， 因为 基于 Unix 的 文本 义理 系统 位 于 支持 技术 学 科 作 家 所 需要 的 高 级 排版 布局 
的 一 流 系 统 之 列 。 


世界 上 最 流行 的 电子 文档 类 型 可 能 就 是 网 页 了 。 网 页 是 文本 文档 ， 它 们 使 用 HTML ( 超 文本 标记 语言 ) 或 者 是 XML (可 扩展 
的 标记 语言 ) 作为 标记 语言 来 描述 文档 的 可 视 格 式 。 


从 本 质 上 来 说 ，email 是 一 个 基于 文本 的 媒介 。 为 了 传输 ， 甚 至 非 文本 的 附件 也 被 转换 成 文本 表示 形式 。 我 们 能 看 到 这 些 ， 
通过 下 载 一 个 email 信息 ， 然 后 用 less 来 浏览 它 。 我 们 将 会 看 到 这 条 信息 开始 于 一 个 标题 ， 其 描述 了 信息 的 来 源 以 及 在 传输 
过 程 中 它 接受 到 的 处 理 ， 然 后 是 信息 的 正文 内 容 。 


在 类 似 于 Unix 的 系统 中 ， 输 出 会 以 纯 文本 格式 发 送 到 打印 机 ， 或 者 如 果 页 面包 含 图 形 ， 其 会 被 转换 成 一 种 文本 格式 的 页 面 
描述 语言 ， 以 PostScript 著称 ， 然 后 再 被 发 送 给 一 款 能 产生 图 形 点 阵 的 程序 ， 最 后 被 打印 出 来 。 


在 类 似 于 Unix 系统 中 会 发 现 许 多 命令 行程 序 被 用 来 支持 系统 管理 和 软件 开发 ， 并 且 文 本 义理 程序 也 不 例外 。 许多 文本 处 理 
程序 被 设计 用 来 解决 软件 开发 问题 。 文 本 处 理 对 于 软件 开发 者 来 言 至 关 重 要 是 因为 所 有 的 软件 都 起 始 于 文本 格式 。 源 代码 
程序 员 实 际 编写 的 一 部 分 程序 ， 总 是 文本 格式 。 


回 到 第 7 章 ( 重 定向 ) ， 我 们 已 经 知道 一 些 命令 除了 接受 命令 行 参 数 之 外 ， 还 能 够 接受 标准 输入 。 那 时 候 我 们 只 是 简单 地 介 
绍 了 它们 ， 但 是 现在 我 们 将 仔细 地 看 一 下 它们 是 怎样 被 用 来 执行 文本 处 理 的 。 


这 个 cat 程序 具有 许多 有 趣 的 选项 。 其 中 许多 选项 用 来 帮助 更 好 的 可 视 化 文本 内 容 。 一 个 例子 是 -A 选项 ， 其 用 来 在 文本 中 显 
示 非 打印 字符 。 有 些 时 候 我 们 想 知道 是 否 控制 字符 伐 入 到 了 我 们 的 可 见 文 本 中 。 最 常用 的 控制 字符 是 tab 字符 (而 不 是 空 

格 ) 和 回 车 字符 ， 在 MS-DOS 风格 的 文本 文件 中 回 车 符 经 常 作为 结束 符 出 现 。 另 一 种 常见 情况 是 文件 中 包含 未 尾 带 有 空格 
的 文本 行 。 


让 我 们 创建 一 个 测试 文件 ， 用 cat 程序 作为 一 个 简单 的 文字 处 理 器 。 为 此 ， 我 们 将 键入 cat 命令 〈 随 后 指定 了 用 于 重 定 向 输 
出 的 文件 ) ， 然 后 输入 我 们 的 文本 ， 最 后 按 下 Enter 键 来 结束 这 一 行 ， 然 后 按 下 组 合 键 Ctrl-d， 来 指示 cat 程序 ， 我 们 已 经 
到 达 文 件 末尾 了 。 在 这 个 例子 中 ， 我 们 文本 行 的 开头 和 末尾 分 别 键入 了 一 个 tab 字符 以 及 一 些 空格 。 





[me@linuxbox ~]$ cat > foo.txt 
The quick brown fox jumped over the lazy dog. 
[me@linuxbox ~]$ 


下 一 步 ， 我 们 将 使 用 带 有 -A 选项 的 cat 命令 来 显示 这 个 文本 : 


[me@linuxbox ~]$ cat -A foo.txt 
人 ^IThe quick brown fox jumped over the lazy dog. $ 
[me@linuxbox ~]$ 


在 输出 结果 中 我 们 看 到 ， 这 个 tab 字符 在 我 们 的 文本 中 由 ^| 字符 来 表示 。 这 是 一 种 常见 的 表示 方法 ， 意 思 是 “Control-"， 结 
果 证 明 ， 它 和 tab 字符 是 一 样 的。 我 们 也 看 到 一 个 $ 字 符 出 现在 文本 行 真正 的 结尾 处 ， 表明 我 们 的 文本 包含 末尾 的 空格 。 


MS-DOS 文本 Vs. Unix 文本 








可 能 你 想 用 cat 程序 在 文本 中 查看 非 打印 字符 的 一 个 原因 是 发 现 隐藏 的 回 车 符 。 那 么 隐藏 的 回 车 符 来 自 于 哪里 呢 ? 它 
们 来 自 于 DOS 和 Windows ! Unix 和 DOS 在 文本 文件 中 定义 每 行 结束 的 方式 不 相同 。Unix 通过 一 个 换行 符 (ASCII 
10) 来 结束 一 行 ， 然 而 MS-DOS 和 它 的 衍生 品 使 用 回 车 (ASCIl13) 和 换行 字符 序列 来 终止 每 个 文本 行 。 





有 几 种 方法 能 够 把 文件 从 DOS 格式 转变 为 Unix 格式 。 在 许多 Linux 系统 中 ， 有 两 个 程序 叫做 dos2unix 和 
unix2dos， 它 们 能 在 两 种 格式 之 间 转 变 文 本 文件 。 然 而 ， 如 果 你 的 系统 中 没有 安装 dos2unix 程序 ， 也 不 要 担心 。 文 
件 从 DOS 格式 转变 为 Unix 格式 的 过 程 非常 简单 ; 它 只 简单 地 涉及 到 删除 违规 的 回 车 符 。 通 过 随后 本 章 中 讨论 的 一 些 
程序 ， 这 个 工作 很 容易 完成 。 


cat 程序 也 包含 用 来 修改 文本 的 选项 。 最 著名 的 两 个 选项 是 -n， 其 给 文本 行 添加 行 号 和 -s， 禁止 输出 多 个 空白 行 。 我 们 这 样 来 
说 明 : 


[me@linuxbox ~]$ cat > foo.txt 
The quick brown fox 


jumped over the lazy dog. 
[me@linuxbox ~]$ cat -ns foo.txt 
1 The quick brown fox 

2 
3 jumped over the lazy dog. 
[me@linuxbox ~]$ 





在 这 个 例子 里 ， 我 们 创建 了 一 个 测试 文件 foo.txt 的 新 版 本 ， 其 包含 两 行文 本 ， 由 两 个 空白 行 分 开 。 经 由 带 有 -ns 选项 的 cat 
程序 处 理 之 后 ， 多 余 的 空白 行 被 吊 除 ， 并 且 对 保留 的 文本 行进 行 编号 。 然而 这 并 不 是 多 个 进程 在 操作 这 个 文本 ， 只 有 一 个 进 


程 。 


这 个 sort 程序 对 标准 输入 的 内 容 ， 或 命令 行 中 指定 的 一 个 或 多 个 文件 进行 排序 ， 然 后 把 排序 结果 发 送 到 标准 输出 。 使 用 与 
cat 命令 相同 的 技巧 ， 我 们 能 够 演示 如 何 用 sort 程序 来 处 理 标 准 输入 : 


[me@linuxbox ~]$ sort > foo.txt 
& 

b 

a 

[me@linuxbox ~]$ cat foo.txt 

a 

b 

G 


输入 命令 之 后 ， 我 们 键入 字母 "c"，“b” 和 "a"， 然 后 再 按 下 Ctrl-d 组 合 键 来 表示 文件 的 结尾 。 随后 我 们 查看 生成 的 文件 ， 看 
到 文本 行 有 序 地 显示 。 


因为 sort 程序 能 接受 命令 行 中 的 多 个 文件 作为 参数 ， 所 以 有 可 能 把 多 个 文件 合并 成 一 个 有 序 的 文件 。 例 如 ， 如 果 我 们 有 三 个 
文本 文件 ， 想 要 把 它们 合并 为 一 个 有 序 的 文件 ， 我 们 可 以 这 样 做 : 


sort filel.txt file2.txt file3.txt > final_sorted list.txt 


sort 程序 有 几 个 有 趣 的 选项 。 这 里 只 是 一 部 分 列表 : 


表 21-1: 常见 的 sort 程序 选项 


选项 长 选项 描述 
时 --ignore-leading- 默认 情况 下 ， 对 整 行进 行 排序 ， 从 每 行 的 第 一 个 字符 开始 。 这 个 选项 导 
blanks 致 sort 程序 忽略 每 行 开 头 的 空格 ， 从 第 一 个 非 空白 字符 开始 排序 。 
二 --ignore-case 让 排序 不 区 分 大 小 写 。 
可 本 0 使 用 此 选项 允许 根据 数字 值 执 行 排序 ， 而 不 
-r --reverse 按 相反 顺序 排序 。 结 果 按 照 降 序 排列 ， 而 不 是 升序 。 
人 ne ei Se st a a 
ei re 把 每 个 参数 看 作 是 一 个 预先 排 好 序 的 文件 。 把 多 个 文件 合并 成 一 个 排 好 
a 序 的 文件 ， 而 没有 执行 额外 的 排序 。 
-0 --output=file 把 排 好 序 的 输出 结果 发 送 到 文件 ， 而 不 是 标准 输出 。 
-t --field-separator=char 定义 域 分 隔 字符 。 上 默认 情况 下 ， 域 由 空格 或 制 表 符 分 隔 。 


虽然 以 上 大 多 数 选项 的 含义 是 不 言 自 喻 的 ， 但 是 有 些 也 不 是 。 首 先 ， 让 我 们 看 一 下 -n 选项 ， 被 用 做 数值 排序 。 通过 这 个 选 
项 ， 有 可 能 基于 数值 进行 排序 。 我 们 通过 对 du 命令 的 输出 结果 排序 来 说 明 这 个 选项 ，du 命令 可 以 确定 最 大 的 磁 胡 空间 用 
户 。 通 常 ， 这 个 du 命 邻 列 出 的 输出 结果 按照 路 径 名 来 排序 : 


[me@linuxbox ~]$ du -s /usrshareAx | head 
252 /usr/share/aclocal 

96 /usr/share/acpi-support 

8 /usr/share/adduser 

196 /usr/share/alacarte 

344 /usr/share/alsa 

8 /usr/share/alsa-base 

12488 /usr/share/anthy 

8 /usrshare/apmd 

21440 /usr/share/app-install 

48 /usr/share/application-registry 


在 这 个 例子 里 面 ， 我 们 把 结果 管道 到 head 命令 ， 把 输出 结果 限制 为 前 10 行 。 我 们 能 够 产生 一 个 按 数值 排序 的 列表 ， 来 显 
示 10 个 最 大 的 空间 消费 者 : 


[me@linuxbox ~]$ du -s /usr/share/* | sort -nr | head 


509940 /usr/share/locale-langpack 
242660 /usr/share/doc 

197560 /usr/share/fonts 

179144 /usr/share/gnome 

146764 /usr/share/myspell 
144304 /usr/share/gimp 

135880 /usr/share/dict 

76508 /usr/share/icons 

68072 /usr/share/apps 

62844 /usr/share/foomatic 


通过 使 用 此 -nr 选项 ， 我 们 产生 了 一 个 反 向 的 数值 排序 ， 最 大 数值 排列 在 第 一 位 。 这 种 排序 起 作用 是 因为 数值 出 现在 每 行 的 
开头 。 但 是 如 果 我 们 想 要 基于 文件 行 中 的 某 个 数值 排序 ， 又 会 怎样 呢 ? 例如 ， 命 令 1s -| 的 输出 结果 : 


[me@linuxbox ~]$ ls -| /usr/bin | head 

total 152948 

-rwWxr-xr-x 1 root root 34824 2008-04-04 02:42[ 
-rwxr-xr-x 1 root root 101556 2007-11-27 06:08 a2p 


此 刻 ， 忽 略 Is 程序 能 按照 文件 大 小 对 输出 结果 进行 排序 ， 我 们 也 能 够 使 用 sort 程序 来 完成 此 任务 : 


[me@linuxbox ~]$ ls -| /usr/bin | sort -nr -k 5 | head 
-rWxXr-xr-Xx 1 root root 8234216 2008-04-0717:42 inkscape 
-rWxr-xr-Xx 1 root root 8222692 2008-04-07 17:42 inkview 


sort 程序 的 许多 用 法 都 涉及 到 人 处理 表格 数据 ， 例 如 上 面 Is 命令 的 输出 结果 。 如 果 我 们 把 数据 库 这 个 术语 应 用 到 上 面 的 表格 

中 ， 我 们 会 说 每 行 是 一 条 记录 ， 并 且 每 条 记录 由 多 个 字段 组 成 ， 例 如 文件 属性 ， 链 接 数 ， 文 件 名 ， 文 件 大 小 等 等 。sort 程序 
能 够 处 理 独立 的 字段 。 在 数据 库 术 语 中 ， 我 们 能 够 指定 一 个 或 者 多 个 关键 字段 ， 来 作为 排序 的 关键 值 。 在 上 面 的 例子 中 ， 我 
们 指定 n 和 Tr 选项 来 执行 相反 的 数值 排序 ， 并 且 指 定 -k 5， 让 sort 程序 使 用 第 五 字段 作为 排序 的 关键 值 。 

这 个 k 选项 非常 有 趣 ， 而 且 还 有 很 多 特点 ， 但 是 首先 我 们 需要 讲 讲 Sort 程序 怎样 来 定义 字段 。 让 我 们 考虑 一 个 非常 简单 的 文 
本 文件 ， 只 有 一 行 包含 作者 名 字 的 文本 。 


William Shotts 


默认 情况 下 ，sort 程序 把 此 行 看 作 有 两 个 字段 。 第 一 个 字段 包含 字符 : 

和 第 二 个 字段 包含 字符 : 

意味 着 空白 字符 (空格 和 制 表 符 ) 被 当 作 是 字段 间 的 界定 符 ， 当 执行 排序 时 ， 界 定 符 会 被 包含 在 字段 当中 。 再 看 一 下 |s 命令 
的 输出 ， 我 们 看 到 每 行 包 含 八 个 字段 ， 并 且 第 五 个 字段 是 文件 大 小 : 


-rWxXr-xr-x 1 root root 8234216 2008-04-07 17:42 inkscape 


让 我 们 考虑 用 下 面 的 文件 ， 其 包含 从 2006 年 到 2008 年 三 款 流行 的 Linux 发 行 版 的 发 行 历史 ， 来 做 一 系列 实验 。 文件 中 的 
每 一 行 都 有 三 个 字段 : 发 行 版 的 名 称 ， 版 本 号 ， 和 MM/DD/YYYY 格式 的 发 行 日 期 : 


SUSE T0212/07/2006 


Fedora T00125 人 2003 
SUSE 11.04 06/19/2008 
Ubuntu 8.04 04/24/2008 
Fedora 8 11/08/2007 


SUSE: 10.3 10/04/2007 


使 用 一 个 文本 编辑 器 (可 能 是 vim) ， 我 们 将 输入 这 些 数据 ， 并 把 产生 的 文件 命名 为 distros.txt。 


下 一 步 ， 我 们 将 试 着 对 这 个 文件 进行 排序 ， 并 观察 输出 结果 : 


[me@linuxbox ~]$ sort distros.txt 


Fedora TELU25Z008 
Fedora SPE03/20/2006 
Fedora 6 10/24/2006 
Fedora 7205/BU2007 
Fedora 8 11/08/2007 


恩 ， 大 部 分 正确 。 问 题 出 现在 Fedora 的 版 本 号 上 。 因 为 在 字符 集中 “1" 出 现在 “5" 之 前 ， 版 本 号 “10" 在 最 顶端 ， 然 而 版 本 
号 “9" 却 掉 到 底 端 。 


为 了 解决 这 个 问题 ， 我 们 必须 依赖 多 个 键 值 来 排序 。 我 们 想 要 对 第 一 个 字段 执行 字母 排序 ， 然 后 对 第 三 个 字段 执行 数值 排 
序 。sort 程序 允许 多 个 -k 选项 的 实例 ， 所 以 可 以 指定 多 个 排序 关键 值 。 事 实 上 ， 一 个 关键 值 可 能 包括 一 个 字段 区 域 。 如 果 没 
有 指定 区 域 (如 同 之 前 的 例子 ) ，sort 程序 会 使 用 一 个 键 值 ， 其 始 于 指定 的 字段 ， 一 直 扩 展 到 行 尾 。 下 面 是 多 键 值 排序 的 语 
法 : 


[me@linuxbox ~]$ sort --key=1,1 --key=2n distros.txt 


Fedora 5 © 03/20/2006 
Fedora 6 10/24/2006 


Fedora V0 055/32007. 


虽然 为 了 清晰 ， 我 们 使 用 了 选项 的 长 格式 ， 但 是 -k 1,1 -k 2n 格式 是 等 价 的 。 在 第 一 个 key 选项 的 实例 中 ， 我 们 指定 了 一 个 

字段 区 域 。 因 为 我 们 只 想 对 第 一 个 字段 排序 ， 我 们 指定 了 1,1， 意味 着 “ 始 于 并 且 结 束 于 第 一 个 字段 。" 在 第 二 个 实例 中 ， 我 们 
指定 了 2n， 意 味 着 第 二 个 字段 是 排序 的 键 值 ， 并 且 按 照 数 值 排序 。 一 个 选项 字母 可 能 被 包含 在 一 个 键 值 说 明 符 的 末尾 ， 其 

用 来 指定 排序 的 种 类 。 这 些 选项 字母 和 sort 程序 的 全 局 选项 一 样 : b (忽略 开头 的 空格 ) ，n (数值 排序 ) ，r (逆向 排 

序 ) ， 等 等 。 





我 们 列表 中 第 三 个 字段 包含 的 日 期 格式 不 利于 排序 。 在 计算 机 中 ， 日 期 通常 设置 为 YYYY-MM-DD 格式 ， 这 样 使 按时 间 顺 序 
排序 变 得 容易 ， 但 是 我 们 的 日 期 为 美国 格式 MM/DD/YYYY。 那 么 我 们 怎样 能 按照 时 间 顺 序 来 排列 这 个 列表 呢 ? 


幸运 地 是 ，sort 程序 提供 了 一 种 方式 。 这 个 key 选项 允许 在 字段 中 指定 偏 移 量 ， 所 以 我 们 能 在 字段 中 定义 键 值 。 


[me@linuxbox ~]$ sort -k 3.7nbr -k 3.1nbr -k 3.4nbr distros.txt 


Fedora L01252008 
Ubuntu 8.10 10/30/2008 


SUSE 11.0 06/19/2008 


通过 指定 -k 3.7， 我 们 指示 sort 程序 使 用 一 个 排序 键 值 ， 其 始 于 第 三 个 字段 中 的 第 七 个 字符 ， 对 应 于 年 的 开头 。 同 样 地 ， 我 
们 指定 -k 3.1 和 -k 3.4 来 分 离 日 期 中 的 月 和 日 。 我 们 也 添加 了 n 和 Tr 选项 来 实现 一 个 道 向 的 数值 排序 。 这 个 b 选项 用 来 删除 
日 期 字段 中 开头 的 空格 ( 行 与 行 之 间 的 空格 数 迎 异 ， 因 此 会 影响 sort 程序 的 输出 结果 ) 。 


一 些 文件 不 会 使 用 tabs 和 空格 做 为 字段 界定 符 ; 例如 ， 这 个 /etc/passwd 文件 : 


[me@linuxbox ~]$ head /etc/passwd 
root:x:0:0:root:/root:/bin/bash 
daemon:x:1:1:daemon:/usrsbin:/bin/sh 
bin:x:2:2:bin:/bin:/bin/sh 
Sys:x:3:3:sys:/dev:/bin/sh 
sync:x:4:65534:sync:/bin:/bin/sync 
games:x:5:60:games:/usr/games:/bin/sh 
man:x:6:12:man:/var/cache/man:/bin/sh 
Ip:x:7:7:lp:/var/spool/lpd:/bin/sh 
mail:x:8:8:mail:/var/mail:/bin/sh 
News:x:9:9:news:/var/spool/news:/bin/sh 


这 个 文件 的 字段 之 间 通 过 冒号 分 隔 开 ， 所 以 我 们 怎样 使 用 一 个 key 字段 来 排序 这 个 文件 ? sort 程序 提供 了 一 个 -t 选项 来 定义 
分 隔 符 。 按 照 第 七 个 字段 (帐户 的 默认 shell) 来 排序 此 passwd 文件 ， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ sort -t ':' -k 7 /etc/passwd | head 
me:x:1001:1001:Myself,,,:/home/me:/bin/bash 
root:x:0:0:root:/root:/bin/bash 
dhcp:x:101:102::/nonexistent:/bin/false 

gdm:x:106:114:Gnome Display Manager:/var/lib/gdm:/bin/false 
hplip:x:104:7:HPLIP system user,,,:/var/run/hplip:/bin/false 
klog:x:103:104::/home/klog:/bin/false 
messagebus:x:108:119::/var/run/dbus:/bin/false 
polkituser:x:110:122:PolicyKit,,,:/var/run/PolicyKit:/bin/false 
pulse:x:107:116:PulseAudio daemon,,,:/var/run/pulse:/bin/false 


通过 指定 冒号 字符 做 为 字段 分 隔 符 ， 我 们 能 按照 第 七 个 字段 来 排序 。 


与 sort 程序 相 比 ， 这 个 uniq 程序 是 个 轻 量 级 程序 。uniq 执行 一 个 看 似 琐碎 的 认为 。 当 给 定 一 个 排 好 序 的 文件 (包括 标准 输 
出 ) ，unid 会 删除 任意 重复 行 ， 并 且 把 结果 发 送 到 标准 输出 。 它 常常 和 sort 程序 一 块 使 用 ， 来 清理 重复 的 输出 。 


uniq 程序 是 一 个 传统 的 Unix 工具 ， 经 常 与 sort 程序 一 块 使 用 ， 但 是 这 个 GNU 版 本 的 sort 程序 支持 一 个 -u 选项 ， 其 可 以 从 
排 好 序 的 输出 结果 中 删除 重复 行 。 





让 我 们 创建 一 个 文本 文件 ， 来 实验 一 下 : 
[me@linuxbox ~]$ cat > foo.txt 


a 
b 
€ 
a 
b 
ce 


记 住 输入 Ctrl-d 来 终止 标准 输入 。 现 在 ， 如 果 我 们 对 文本 文件 执行 uniq 命令 : 


[me@linuxbox ~]$ uniq foo.txt 


Ch TO SS 


输出 结果 与 原始 文件 没有 差异 ; 重复 行 没有 被 删除 。 实 际 上 ，uniq 程序 能 完成 任务 ， 其 输入 必须 是 排 好 序 的 数据 ， 
[me@linuxbox ~]$ sort foo.txt | uniq 


a 
b 
C 


这 是 因为 uniq 只 会 删除 相 邻 的 重复 行 。uniq 程序 有 几 个 选项 。 这 里 是 一 些 常用 选项 : 


表 21-2: 常用 的 uniq 选项 


选项 说 明 
-C 输出 所 有 的 重复 行 ， 并 且 每 行 开头 显示 重复 的 次 数 。 
-d 只 输出 重复 行 ， 而 不 是 特有 的 文本 行 。 


忽略 每 行 开 头 的 n 个 字段 ， 字 段 之 间 由 空格 分 隔 ， 正 如 sort 程序 中 的 空格 分 隔 符 ; 然 
而 ， 不 同 于 sort 程序 ，uniq 没有 选项 来 设置 备用 的 字段 分 隔 符 。 


-i 在 比较 文本 行 的 时 候 忽 略 大 小 写 。 


-Sn 跳 过 (忽略) 每 行 开头 的 n 个 字符 。 
-U 只 是 输出 独 有 的 文本 行 。 这 是 默认 的 。 


这 里 我 们 看 到 uniq 被 用 来 报告 文本 文件 中 重复 行 的 次 数 ， 使 用 这 个 -c 选项 : 


[me@linuxbox ~]$ sort foo.txt | uniq -c 
2a 
2 
2 


下 面 我 们 将 要 讨论 的 三 个 程序 用 来 从 文件 中 获得 文本 列 ， 并 且 以 有 用 的 方式 重组 它们 。 
这 个 cut 程序 被 用 来 从 文本 行 中 抽取 文本 ， 并 把 其 输出 到 标准 输出 。 它 能 够 接受 多 个 文件 参数 或 者 标准 输入 。 
从 文本 行 中 指定 要 抽取 的 文本 有 些 麻 烦 ， 使 用 以 下 选项 : 


表 21-3: cut 程序 选择 项 
选项 说 明 


ee 从 文本 行 中 抽取 由 char_list 定义 的 文本 。 这 个 列表 可 能 由 一 个 或 多 个 喜 号 分 隔 开 的 数值 
ef 区 间 组 成 。 


从 文本 行 中 抽取 一 个 或 多 个 由 field_list 定义 的 字段 。 这 个 列表 可 能 包括 一 个 或 多 个 字 


人 段 ， 或 由 去 号 分 隔 开 的 字段 区 间 。 

De 当 指 定 -f 选 项 之 后 ， 使 用 delim_char 做 为 字段 分 隔 符 。 上 默认 情况 下 ， 字段 之 间 必 须 由 单 
到 个 tab 字符 分 隔 开 。 

--complement 抽取 整个 文本 行 ， 除 了 那些 由 -c 和 及 或-f 选 项 指定 的 文本 。 


正如 我 们 所 看 到 的 ，cut 程序 抽取 文本 的 方式 相当 不 灵活 。cut 命令 最 好 用 来 从 其 它 程序 产生 的 文件 中 抽取 文本 ， 而 不 是 从 人 
们 直接 输入 的 文本 中 抽取 。 我 们 将 会 看 一 下 我 们 的 distros.txt 文件 ， 看 看 是 否 它 足够 “整齐 "成 为 cut 实例 的 一 个 好 样本 。 如 
果 我 们 使 用 带 有 -A 选项 的 cat 命令 ， 我 们 能 查看 是 否 这 个 文件 符号 由 tab 字符 分 离 字段 的 要 求 。 





[me@linuxbox ~]$ cat -A distros.txt 
SUSE^110.2^112/07/2006$ 
Fedora^ 人 1I10^ 人 111/25/2008$ 
SUSE^ 人 1I11.0^ 人 106/19/2008$ 
Ubuntu^ 人 18.04^ 人 104/24/2008$ 
Fedora^ 人 18 人 ^ 人 I11/08/2007$ 
SUSE^110.3^110/04/2007$ 
Ubuntu^ 人 16.10 人 110/26/2006$ 
Fedora^ 人 17^ 人 105/31/2007$ 
Ubuntu^ 人 17.10 人 110/18/2007$ 
Ubuntu^ 人 17.04 人 104/19/2007$ 
SUSE^ 人 1I10.1^ 人 105/11/2006$ 
Fedora^ 人 16 人 110/24/2006$ 
Fedora^ 人 19 人 105/13/2008$ 
Ubuntu^ 人 16.06^ 人 106/01/2006$ 
Ubuntu^ 人 18.10^ 人 110/30/2008$ 
Fedora^ 人 15 人 103/20/2006$ 














看 起 来 不 错 。 字 段 之 间 仅 仅 是 单个 tab 字符 ， 没 有 嵌入 空格 。 因 为 这 个 文件 使 用 了 tab 而 不 是 空格 ， 我 们 将 使 用 -f 选 项 来 抽 
取 一 个 字段 : 


[me@linuxbox ~]$ cut -f 3 distros.txt 
12/07/2006 
11/25/2008 
06/19/2008 
04/24/2008 
11/08/2007 
10/04/2007 
10/26/2006 
05/31/2007 
10/18/2007 
04/19/2007 
05/11/2006 
10/24/2006 
05/13/2008 
06/01/2006 
10/30/2008 
03/20/2006 


因为 我 们 的 distros 文件 是 由 tab 分 隔 开 的 ， 最 好 用 cut 来 抽取 字段 而 不 是 字符 。 这 是 因为 一 个 由 tab 分 离 的 文件 ， 每 行 不 太 
可 能 包含 相同 的 字符 数 ， 这 就 使 计算 每 行 中 字符 的 位 置 变 得 困难 或 者 是 不 可 能 。 在 以 上 事例 中 ， 然 而 ， 我 们 已 经 抽取 了 一 个 
字段 ， 幸 运 地 是 其 包含 地 日 期 长 度 相同 ， 所 以 通过 从 每 行 中 抽取 年 份 ， 我 们 能 展示 怎样 来 抽取 字符 : 


[me@linuxbox ~]$ cut -f 3 distros.txt | cut -c 7-10 


2006 
2008 
2007 
2006 
2007 
2006 
2008 
2006 
2008 
2006 


通过 对 我 们 的 列表 再 次 运行 cut 命令 ， 我 们 能 够 抽取 从 位 置 7 到 10 的 字符 ， 其 对 应 于 日 期 字段 的 年 份 。 这 个 7-10 表示 法 是 一 
个 区 间 的 例子 。cut 命令 手册 包含 了 一 个 如 何 指定 区 闻 的 完整 描述 。 





展开 Tabs 





distros.txt 的 文件 格式 很 适合 使 用 cut 程序 来 抽取 字段 。 但 是 如 果 我 们 想 要 cut 程序 按照 字符 ， 








而 不 是 字段 来 操作 一 个 


文件 ， 那 又 怎样 呢 ? 这 要 求 我 们 用 相应 数目 的 空格 来 代替 tab 字符 。 幸 运 地 是 ，GNU 的 Coreutils 软件 包 有 一 个 工具 


来 解决 这 个 问题 。 这 个 程序 名 为 expand， 它 既 可 以 接受 一 个 或 多 个 文件 参数 ， 也 可 以 接受 标准 


的 文本 送 到 标准 输出 。 





E 输 入 ， 并 且 把 修改 过 


如 果 我 们 通过 expand 来 处 理 distros.txt 文件 ， 我 们 能 够 使 用 cut -c 命令 来 从 文件 中 抽取 任意 区 间 内 的 字符 。 例 如 ， 


我 们 能 够 使 用 以 下 命令 来 从 列表 中 抽取 发 行 年 份 ， 通 过 展开 此 文件 ， 再 使 用 cut 命令 ， 来 抽取 从 位 置 23 3 


每 一 个 字符 : 




















[me @linuxbox ~]$ expand distros.txt | cut -c 23- 


Coreutils 软件 包 也 提供 了 unexpand 程序 ， 





用 tab 来 代替 空格 。 


开始 到 行 尾 的 


当 操 作 字段 的 时 候 ， 有 可 能 指定 不 同 的 字段 分 隔 符 ， 而 不 是 tab 字符 。 这 里 我 们 将 会 从 /etc/passwd 文件 中 抽取 第 一 个 字 
段 : 


[me@linuxbox ~]$ cut -d ':'-f 1 /etc/passwd | head 
root 
daemon 
bin 

sys 
sync 
games 
man 

1p 

mail 
news 


使 用 -d 选项 ， 我 们 能 够 指定 冒号 做 为 字段 分 隔 符 。 

这 个 paste 命令 的 功能 正好 与 cut 相反 。 它 会 添加 一 个 或 多 个 文本 列 到 文件 中 ， 而 不 是 从 文件 中 抽取 文本 列 。 它 通过 读 取 多 
个 文件 ， 然 后 把 每 个 文件 中 的 字段 整合 成 单个 文本 流 ， 输 入 到 标准 输出 。 类 似 于 cut 命 分 ， paste 接受 多 个 文件 参数 和 一 或 
标准 输入 。 为 了 说 明 paste 是 怎样 工作 的 ， 我 们 将 会 对 distros.txt 文件 动手 术 ， 来 产生 发 行 版 的 年 代表 。 


从 我 们 之 前 使 用 sort 的 工作 中 ， 首 先 我 们 将 产生 一 个 按照 日 期 排序 的 发 行 版 列表 ， 并 把 结果 存储 在 一 个 叫做 distros-by- 
date txt 的 文件 中 : 


[me@linuxbox ~]$ sort -k 3.7nbr -k 3.1nbr -k 3.4nbr distros.txt > distros-by-date.txt 


下 一 步 ， 我 们 将 会 使 用 cut 命令 从 文件 中 抽取 前 两 个 字段 (发行 版 名 字 和 版 本 号 ) ， 并 把 结果 存储 到 一 个 名 为 distro- 
versions.txt 的 文件 中 : 


[me@linuxbox ~]$ cut -f 1,2 distros-by-date.txt > distros-versions.txt 
[me@linuxbox ~]$ head distros-versions.txt 


Fedora 10 
Ubuntu 8.10 
SUSE 11.0 
Fedora 9 
Ubuntu 8.04 
Fedora 8 
Ubuntu 710 
SUSE 10.3 
Fedora 7 


Ubuntu 7.04 


最 后 的 准 各 步骤 是 抽取 发 行 日 期 ， 并 把 它们 存储 到 一 个 名 为 distro-dates.txt 文件 中 : 


[me@linuxbox ~]$ cut -f3 distros-by-date.txt > distros-dates.txt 
[me@linuxbox ~]$ head distros-dates.txt 
11/25/2008 

10/30/2008 

06/19/2008 

05/13/2008 

04/24/2008 

11/08/2007 

10/18/2007 

10/04/2007 

05/31/2007 

04/19/2007 


现在 我 们 拥有 了 我 们 所 需要 的 文本 了 。 为 了 完成 这 个 过 程 ， 使 用 paste 命令 来 把 日 期 列 放 到 发 行 版 名 字 和 版 本 号 的 前 面 ， 这 
样 就 创建 了 一 个 年 代 列 表 。 通 过 使 用 paste 命令 ， 然 后 按照 期 望 的 顺序 来 安排 它 的 参数 ， 就 能 很 容易 完成 这 个 任务 。 


[me@linuxbox ~]$ paste distros-dates.txt distros-versions.txt 
11/25/2008 Fedora 10 
10/30/2008 Ubuntu 8.10 
06/19/2008 SUSE L110 
05/13/2008 Fedora 9 
04/24/2008 Ubuntu 8.04 
11/08/2007 Fedora 8 
10/18/2007 Ubuntu a Ro 
10/04/2007 SUSE 1033 
05/31/2007 Fedora 7 
04/19/2007 Ubuntu 7.04 


在 某 些 方面 ，join 命令 类 似 于 paste， 它 会 往 文件 中 添加 列 ， 但 是 它 使 用 了 独特 的 方法 来 完成 。 一 个 join 操作 通常 与 关系 型 
数据 库 有 关联 ， 在 关系 型 数据 库 中 来 自 多 个 享有 共同 关键 域 的 表格 的 数据 结合 起 来 ， 得 到 一 个 期 望 的 结果 。 这 个 join 程序 执 
行 相同 的 操作 。 它 把 来 自 于 多 个 基于 共享 关键 域 的 文件 的 数据 结合 起 来 。 


为 了 知道 在 关系 数据 库 中 是 怎样 使 用 join 操作 的 ， 让 我 们 想象 一 个 很 小 的 数据 库 ， 这 个 数据 库 由 两 个 表格 组 成 ， 每 个 表格 包 


一 条 记录 。 第 一 个 表格 ， 叫 做 CUSTOMERS， 有 三 个 数据 域 : 一 个 客户 号 (CUSTNUM) ， 客户 的 名 字 (FNAME) 和 客 
户 的 姓 (LNAME) 


CUSTNUM FNAME ME 








4681934 John Smith 


第 二 个 表格 叫做 ORDERS， 其 包含 四 个 数据 域 : 订单 号 (ORDERNUM) ， 客 户 号 (CUSTNUM) ， 数 量 (QUAN) ， 和 
订购 的 货品 (ITEM) 。 


ORDERNUM CUSTNUM QUAN ITEM 








3014953305 4681934 1 Blue Widget 


注意 两 个 表格 共享 数据 域 CUSTNUM。 这 很 重要 ， 因 为 它 使 表格 之 间 建 立 了 联系 。 


执行 一 个 join 操作 将 允许 我 们 把 两 个 表格 中 的 数据 域 结合 起 来 ， 得 到 一 个 有 用 的 结果 ， 例 如 准 各 一 张 发 货 单 。 通 过 使 用 两 个 
表格 CUSTNUM 数字 域 中 匹配 的 数值 ， 一 个 join 操作 会 产生 以 下 结果 : 


FNAME LNAME QUAN ITEM 








John Smith 1 Blue Widget 


为 了 说 明 join 程序 ， 我 们 需要 创建 一 对 包含 共享 键 值 的 文件 。 为 此 ， 我 们 将 使 用 我 们 的 distros.txt 文件 。 从 这 个 文件 中 ， 我 
们 将 构建 额外 两 个 文件 ， 一 个 包含 发 行 日 期 (其 会 成 为 共享 键 值 ) 和 发 行 版 名 称 : 


[me@linuxbox ~]$ cut -f1,1 distros-by-date.txt > distros-names.txt 
[me@linuxbox ~]$ paste distros-dates.txt distros-names.txt > distros-key-names.txt 
[me@linuxbox ~]$ head distros-key-names.txt 

11/25/2008 Fedora 

10/30/2008 Ubuntu 

06/19/2008 SUSE 

05/13/2008 Fedora 

04/24/2008 Ubuntu 

11/08/2007 Fedora 

10/18/2007 Ubuntu 

10/04/2007 SUSE 

05/31/2007 Fedora 

04/19/2007 Ubuntu 


第 二 个 文件 包含 发 行 日 期 和 版 本 号 : 


[me@linuxbox ~]$ cut -f2,2 distros-by-date.txt > distros-vernums.txt 
[me@linuxbox ~]$ paste distros-dates.txt distros-vernums.txt > distros-key-vernums.txt 
[me@linuxbox ~]$ head distros-key-vernums.txt 

11/25/2008 10 

10/30/2008 8.10 

06/19/2008 11.0 

05/13/2008 9 

04/24/2008 8.04 

11/08/2007 8 

10/18/2007 7.10 

10/04/2007 10.3 

05/31/2007 7 

04/19/2007 7.04 


现在 我 们 有 两 个 具有 共享 键 值 (“ 发 行 日 期 " 数据 域 ) 的 文件 。 有 必要 指出 ， 为 了 使 join 命令 能 正常 工作 ， 所 有 文件 必须 按 
照 关键 数据 域 排序 。 


[me@linuxbox ~]$ join distros-key-names.txt distros-key-vernums.txt | head 
11/25/2008 Fedora 10 
10/30/2008 Ubuntu 8.10 
06/19/2008 SUSE 11.0 
05/13/2008 Fedora 9 
04/24/2008 Ubuntu 8.04 
11/08/2007 Fedora 8 
10/18/2007 Ubuntu 7.10 
10/04/2007 SUSE 10.3 
05/31/2007 Fedora 7 
04/19/2007 Ubuntu 7.04 


也 要 注意 ， 默 认 情 况 下 ，join 命令 使 用 空白 字符 做 为 输入 字段 的 界定 符 ， 一 个 空格 作为 输出 字段 的 界定 符 。 这 种 行为 可 以 通 
过 指定 的 选项 来 修改 。 详 细 信 息 ， 参 考 join 命令 手册 。 


比较 文本 


通常 比较 文本 文件 的 版 本 很 有 帮助 。 对 于 系统 管理 员 和 软件 开发 者 来 说 ， 这 个 尤为 重要 。 一 名 系统 管理 员 可 能 ， 例 如 ， 需 要 
拿 现 有 的 配置 文件 与 先前 的 版 本 做 比较 ， 来 诊断 一 个 系统 错误 。 同样 的 ， 一 名 程序 员 经 常 需要 查看 程序 的 修改 。 





这 个 comm 程序 会 比较 两 个 文本 文件 ， 并 且 会 显示 每 个 文件 特有 的 文本 行 和 共有 的 文 把 行 。 为 了 说 明 问 题 ， 通 过 使 用 cat 命 
今 ， 我 们 将 会 创建 两 个 内 容 几乎 相同 的 文本 文件 : 


[me@linuxbox ~]$ cat > filel.txt 
a 
b 
€ 
d 
[me@linuxbox ~]$ cat > file2.txt 


b 
& 
d 
e 


下 一 步 ， 我 们 将 使 用 comm 命令 来 比较 这 两 个 文件 : 


[me@linuxbox ~]$ comm filel.txt file2.txt 
a 


对 


正如 我 们 所 见 到 的 ，comm 命令 产生 了 三 列 和 输出。 第 一 列 包含 第 一 个 文件 独 有 的 文本 行 ; 第 二 列 ， 文本 行 是 第 二 列 独 有 的 ; 
第 三 列 包 含 两 个 文件 共有 的 文本 行 。comm 支持 -n 形式 的 选项 ， 这 里 n 代表 1，2 或 3。 这 些 选 项 使 用 的 时 人 息 ， 指 定 了 要 隐 
藏 的 列 。 例 如 ， 如 果 我 们 只 想 输 出 两 个 文件 共享 的 文本 行 ， 我 们 将 隐藏 第 一 列 和 第 二 列 的 输出 结果 : 


[me@linuxbox ~]$ comm -12 filel.txt file2.txt 
b 
E 
d 


类 似 于 comm 程序 ，diff 程序 被 用 来 监测 文件 之 间 的 差异 。 然 而 ，diff 是 一 款 更 加 复 末 的 工具 ， 它 支持 许多 输出 格式 ， 并 且 
一 次 能 处 理 许多 文本 文件 。 软 件 开发 员 经 常 使 用 diff 程序 来 检查 不 同 程序 源码 版 本 之 间 的 更 改 ，diff 能 够 递归 地 检查 源码 目 
录 ， 经 常 称 之 为 源码 树 。diff 程序 的 一 个 常见 用 例 是 创建 diff 文件 或 者 补丁 ， 它 会 被 其 它 程序 使 用 ， 例 如 patch 程序 (我们 
一 会 儿 讨论 ) ， 来 把 文件 从 一 个 版 本 转换 为 另 一 个 版 本 。 


如 果 我 们 使 用 diff 程序 ， 来 查看 我 们 之 前 的 文件 实例 : 


[me@linuxbox ~]$ diff file1.txt file2.txt 
1d0 
<a 
4a4 
>e 


我 们 看 到 diff 程序 的 默认 输出 风格 : 对 两 个 文件 之 间 差异 的 简短 描述 。 在 默认 格式 中 ， 每 组 的 更 改 之 前 都 是 一 个 更 改 命 爸 ， 
其 形式 为 range operation range ， 用 来 描述 要 求 更 改 的 位 置 和 类 型 ， 从 而 把 第 一 个 文件 转变 为 第 二 个 文件 : 


表 21-4: diff 更 改 命 命 


改变 说 明 
riar2 把 第 二 个 文件 中 位 置 r2 处 的 文件 行 添加 到 第 一 个 文件 中 的 r1 处 。 
ricr2 用 第 二 个 文件 中 位 置 r2 处 的 文本 行 更 改 (替代 ) 位 置 r1 处 的 文本 行 。 
11dr2 ee 


在 这 种 格式 中 ， 一 个 范围 就 是 由 逗号 分 隔 开 的 开头 行 和 结束 行 的 列表 。 哩 然 这 种 格式 是 默认 情况 (主要 是 为 了 服从 POSIX 
标准 且 向 后 与 传统 的 Unix diff 命令 兼容 ) ， 但 是 它 并 不 像 其 它 可 选 格式 一 样 被 广泛 地 使 用 。 最 流行 的 两 种 格式 是 上 下 文 模式 
和 统一 模式 。 


当 使 用 上 下 文 模式 ( 带 上 -c 选项 ) ， 我 们 将 看 到 这 些 : 


[me@linuxbox ~]$ diff -c file1 .txt file2.txt 
*** filel.txt 2008-12-23 06:40:13.000000000 -0500 
--- file2.txt 2008-12-23 06:40:34.000000000 -0500 


六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 
六 六 六 了 ,4 六 六 六 六 
a 
b 
Cy 
d 
FE 二 村 ee 
b 


€ 
d 


和 


这 个 输出 结果 以 两 个 文件 名 和 它们 的 时 间 戳 开头。 第 一 个 文件 用 星 号 做 标记 ， 第 二 个 文件 用 短 横 线 做 标记 。 纵 观 列表 的 其 它 
部 分 ， 这 些 标记 将 象征 它们 各 自 代 表 的 文件 。 下 一 步 ， 我 们 看 到 几 组 修改 ， 包括 默认 的 周围 上 下 文 行 数 。 在 第 一 组 中 ， 我 们 
看 到 : 


bh 





其 表示 第 一 个 文件 中 从 第 一 行 到 第 四 行 的 文本 行 。 随 后 我 们 看 到 : 


A 





这 表示 第 二 个 文件 中 从 第 一 行 到 第 四 行 的 文本 行 。 在 更 改组 内 ， 文 本 行 以 四 个 指示 符 之 一 开头 : 
表 21-5 : diff 上 下 文 模式 更 改 指示 符 
指示 符 意思 
blank 上 下 文 显示 行 。 它 并 不 表示 两 个 文件 之 间 的 差异 。 
删除 行 。 这 一 行将 会 出 现在 第 一 个 文件 中 ， 而 不 是 第 二 个 文件 内 。 
十 添加 行 。 这 一 行将 会 出 现在 第 二 个 文件 内 ， 而 不 是 第 一 个 文件 中 。 
! 更 改行 。 将 会 显示 某 个 文本 行 的 两 个 版 本 ， 每 个 版 本 会 出 现在 更 改组 的 各 自 部 分 。 


这 个 统一 模式 相似 于 上 下 文 模式 ， 但 是 更 加 简洁 。 通 过 -u 选项 来 指定 它 : 


[me@linuxbox ~]$ diff -u filel.txt file2.txt 

---filel.txt 2008-12-23 06:40:13.000000000 -0500 
+++ file2.txt 2008-12-23 06:40:34.000000000 -0500 
@@ -1,4 +1,4 @@ 

-a 


二 全 


上 下 文 模式 和 统一 模式 之 间 最 显著 的 差异 就 是 重复 上 下 文 的 消除 ， 这 就 使 得 统一 模式 的 输出 结果 要 比 上 下 文 模式 的 输出 结果 
简短 。 在 我 们 上 述 实例 中 ， 我 们 看 到 类 似 于 上 下 文 模式 中 的 文件 时 间 稚 ， 其 紧 紧 跟随 字符 串 @@ -1,4 +1,4 @@。 这 行 字符 
串 表 示 了 在 更 改组 中 描述 的 第 一 个 文件 中 的 文本 行 和 第 二 个 文件 中 的 文本 行 。 这 行 字符 串 之 后 就 是 文本 行 本 身 ， 和 与 三 行 默 认 
的 上 下 文 。 每 行 以 可 能 的 三 个 字符 中 的 一 个 开头 : 





表 21-6 : diff 统一 模式 更 改 指 示 符 


空格 两 个 文件 都 包含 这 一 行 。 
在 第 一 个 文件 中 删除 这 一 行 。 
a 添加 这 一 行 到 第 一 个 文件 中 。 


这 个 patch 程序 被 用 来 把 更 改 应 用 到 文本 文件 中 。 它 接受 从 dif 程序 的 输出 ， 并 且 通 常 被 用 来 把 较 老 的 文件 版 本 转变 为 较 新 
的 文件 版 本 。 让 我 们 考虑 一 个 著名 的 例子 。Linux 内 核 是 由 一 个 大 型 的 ， 组 织 松散 的 贡献 者 团队 开发 而 成 ， 这 些 贡 献 者 会 提 
交 固 定 的 少量 更 改 到 源码 包 中 。 这 个 Linux 内 核 由 几 百 万 行 代码 组 成 ， 虽 然 每 个 贡献 者 每 次 所 做 的 修改 相当 少 。 对 于 一 个 贡 
献 者 来 说 ， 每 做 一 个 修改 就 给 每 个 开发 者 发 送 整个 的 内 核 源 码 树 ， 这 是 没有 任何 意义 的 。 相 反 ， 提交 一 个 diff 文件 。 一 个 

diff 文件 包含 先前 的 内 核 版 本 与 带 有 贡献 者 修改 的 新 版 本 之 间 的 差异 。 然后 一 个 接受 者 使 用 patch 程序 ， 把 这 些 更 改 应 用 到 
他 自己 的 源码 树 中 。 使 用 diff/patch 组 合 提供 了 两 个 重大 优点 : 


1. 一 个 diff 文件 非常 小 ， 与 整个 源码 树 的 大 小 相 比 较 而 言 。 
2. 一 个 diff 文 件 简洁 地 显示 了 所 做 的 修改 ， 从 而 允许 程序 补丁 的 审阅 者 能 快速 地 评估 它 。 


当然 ，diff/patch 能 工作 于 任何 文本 文件 ， 不 仅仅 是 源码 文件 。 它 同样 适用 于 配置 文件 或 任意 其 它 文本 。 





准备 一 个 diff 文件 供 patch 程序 使 用 ，GNU 文档 (查看 下 面 的 拓展 阅读 部 分 ) 建议 这 样 使 用 diff 命令 : 


diff -Naur old file new file > diff file 


old_file 和 new_file 部 分 不 是 单个 文件 就 是 包含 文件 的 目录 。 这 个 了 选项 支持 递归 目录 树 。 





一 旦 创建 了 dif 文件， 我 们 就 能 应 用 它 ， 把 旧 文 件 修补 成 新 文件 。 


patch < diff file 


我 们 将 使 用 测试 文件 来 说 明 : 


[me@linuxbox ~]$ diff -Naurfilel.txt file2.txt &gt; patchfile.txt 
[me@linuxbox ~]$ patch &lt; patchfile.txt 

patching file file1 .txt 

[me@linuxbox ~]$ cat file1.txt 


b 
d 
(3 
在 这 个 例子 中 ， 我 们 创建 了 一 个 名 为 patchfile.txt 的 diff 文件 ， 然 后 使 用 patch 程序 ， 来 应 用 这 个 补丁 。 注 意 我 们 没有 必要 


指定 一 个 要 修补 的 目标 文件 ， 因 为 diff 文件 (在 统一 模式 中 ) 已 经 在 标题 行 中 包含 了 文件 名 。 一 旦 应 用 了 补丁 ， 我 们 能 看 
到 ， 现 在 file1.txt 与 file2.txt 文 件 相 匹配 了 。 


patch 程序 有 大 量 的 选项 ， 而 且 还 有 额外 的 实用 程序 可 以 被 用 来 分 析 和 编辑 补丁 。 
运行 时 编辑 


我 们 对 于 文本 编辑 器 的 经 验 是 它们 主要 是 交互 式 的 ， 意 思 是 我 们 手动 移动 光标 ， 然 后 输入 我 们 的 修改 。 然而 ， 也 有 非 交 互 式 
的 方法 来 编辑 文本 。 有 可 能 ， 例 如 ， 通 过 单个 命令 把 一 系列 修改 应 用 到 多 个 文件 中 。 


这 个 tr 程序 被 用 来 更 改 字符 。 我 们 可 以 把 它 看 作 是 一 种 基于 字符 的 查找 和 蔡 换 操作 。 换 字 是 一 种 把 字符 从 一 个 字母 转换 为 另 
一 个 字母 的 过 程 。 例 如 ， 把 小 写字 母 转 换 成 大 写字 母 就 是 换 字 。 我 们 可 以 通过 tr 命令 来 执行 这 样 的 转换 ， 如 下 所 示 : 


[me@linuxbox ~]$ echo "lowercase letters" | tr a-z A-Z 
LOWERCASE LETTERS 


正如 我 们 所 见 ，tr 命令 操作 标准 输入 ， 并 把 结果 输出 到 标准 输出 。tr 命令 接受 两 个 参数 : 要 被 转换 的 字符 集 以 及 相对 应 的 转 
换 后 的 字符 集 。 字 符 集 可 以 用 三 种 方式 来 表示 : 
1. 一 个 枚 举 列 表 。 例 如 ， ABCDEFGHIJKLMNOPQRSTUVWXYZ 


2. 一 个 字符 域 。 例 如 ，A-Z 。 注 意 这 种 方法 有 时 候 面 临 与 其 它 命令 相同 的 问题 ， 妇 因 于 语系 的 排序 规则 ， 因 此 应 该 谨慎 使 
用 。 


3. POSIX 字符 类 。 例 如 ，[:upperj] 
大 多 数 情 况 下 ， 两 个 字符 集 应 该 长 度 相同 ; 然而 ， 有 可 能 第 一 个 集合 大 于 第 二 个 ， 尤 其 如 果 我 们 想 要 把 多 个 字符 转换 为 单个 


字符 : 


[me@linuxbox ~]$ echo "lowercase letters" | tr [:lower:] A 
AAAAAAAAA AAAAAAA 


除了 换 字 之 外 ，tr 命令 能 允许 字符 从 输入 流 中 简单 地 被 删除 。 在 之 前 的 章节 中 ， 我 们 讨论 了 转换 MS-DOS 文本 文件 为 Unix 
风格 文本 的 问题 。 为 了 执行 这 个 转换 ， 每 行 末尾 的 回 车 符 需 要 被 删除 。 这 个 可 以 通过 tr 命令 来 执行 ， 如 下 所 示 : 


tr-d \r'< dos file > unix file 


这 里 的 dos_file 是 需要 被 转换 的 文件 ，unix_file 是 转换 后 的 结果 。 这 种 形式 的 命令 使 用 转 义 序列 Y 来 代表 回 车 符 。 查 看 tr 命 
今 所 支持 地 完整 的 转 义 序列 和 字符 类 别 列表 ， 试 试 下 面 的 命令 : 


[me@linuxbox ~]$ tr --help 


ROT13: 不 那么 秘密 的 编码 环 


tr 命令 的 一 个 有 趣 的 用 法 是 执行 ROT13 文 本 编码 。ROT13 是 一 款 微不足道 的 基于 一 种 简易 的 替换 瞳 码 的 加 密 类 型 。 

把 ROT13 称 为 “加 密 "是 大 方 的 ; “文本 模糊 处 理 " 更 准确 些 。 有 时 候 它 被 用 来 隐藏 文本 中 潜在 的 攻击 内 容 。 这 个 方法 就 
是 简单 地 把 每 个 字符 在 字母 表 中 向 前 移动 13 位 。 因 为 移动 的 位 数 是 可 能 的 26 个 字符 的 一 半 ， 所 以 对 文本 再 次 执行 这 个 
算法 ， 就 恢复 到 了 它 最 初 的 形式 。 通 过 tr 命令 来 执行 这 种 编码 : 























echo "secret text" | tr a-zA-Z n-za-MN-ZA-M 


frperg grkg 





再 次 执行 相同 的 过 程 ， 得 到 翻译 结果 : 
echo "frperg grkg" | tr a-zA-Z n-za-mN-ZA-M 
secret text 


量 的 email 程序 和 USENET 新 闻 读 者 都 支持 ROT13 编码 。Wikipedia 上 面 有 一 篇 关于 这 个 主题 的 好 文章 : 





http://en.wikipedia.org/Wwiki/ROT13 


tr 也 可 以 完成 另 一 个 技巧 。 使 用 -s 选项 ，tr 命令 能 “ 挤 压 ” (删除 ) 重复 的 字符 实例 : 


[me@linuxbox ~]$ echo "aaabbbccc" | tr -s ab 
abccc 


这 里 我 们 有 一 个 包含 重复 字符 的 字符 串 。 通 过 给 tr 命令 指定 字符 集 “ab"， 我 们 能 够 消除 字符 集中 字母 的 重复 实例 ， 然 而 会 留 
下 不 属于 字符 集 的 字符 (“c”) 无 更 改 。 注 意 重 复 的 字符 必须 是 相 邻 的 。 如 果 它 们 不 相 邻 : 


[me@linuxbox ~]$ echo "abcabcabc" |tr -s ab 
abcabcabc 


那么 挤 压 会 没有 效果 。 


名 字 sed 是 stream editor 〈 流 编辑 器 ) 的 简称 。 它 对 文本 流 进行 编辑 ， 要 不 是 一 系列 指定 的 文件 ， 要 不 就 是 标准 输入 。sed 
是 一 款 强大 的 ， 并 且 有 些 复杂 的 程序 (有 整 本 内 容 都 是 关于 sed 程序 的 书籍 ) ， 所 以 在 这 里 我 们 不 会 详尽 的 讨论 它 。 


总 之 ，Sed 的 工作 方式 是 要 不 给 出 单个 编辑 命令 〈 在 命令 行 中 ) 要 不 就 是 包含 多 个 命令 的 脚本 文件 名 ， 然后 它 就 按 行 来 执行 
这 些 命令 。 这 里 有 一 个 非常 简单 的 sed 实例 : 


[me@linuxbox ~]$ echo "front" | sed 's/front/back/' 
back 


在 这 个 例子 中 ， 我 们 使 用 echo 命令 产生 了 一 个 单词 的 文本 流 ， 然 后 把 它 管 道 给 sed 命令 。sed， 依 次 ， 对 流 文本 执行 指 今 
s/frontback/， 随 后 输出 “back"。 我 们 也 能 够 把 这 个 命令 认为 是 相似 于 vi 中 的 “替换 ” (查找 和 替代 ) 命令 。 


sed 中 的 命令 开始 于 单个 字符 。 在 上 面 的 例子 中 ， 这 个 替换 命令 由 字母 s 来 代表 ， 其 后 跟着 查找 和 蔡 代 字 符 串 ， 斜 杠 字符 做 
为 分 隔 符 。 分 隔 符 的 选择 是 随意 的 。 按 照 惯例 ， 经 常 使 用 斜 杠 字符 ， 但 是 sed 将 会 接受 紧 随 命令 之 后 的 任意 字符 做 为 分 隔 
符 。 我 们 可 以 按照 这 种 方式 来 执行 相同 的 命令 : 


[me@linuxbox ~]$ echo "front" | sed 's\ front\_back\ ' 
back 


通过 紧 跟 命 令 之 后 使 用 下 划 线 字符 ， 则 它 变 成 界定 符 。sed 可 以 设置 界定 符 的 能 力 ， 使 命令 的 可 读 性 更 强 ， 正如 我 们 将 看 到 
的 . 

sed 中 的 大 多 数 命 令 之 前 都 会 带 有 一 个 地 址 ， 其 指定 了 输入 流 中 要 被 编辑 的 文本 行 。 如 果 省 略 了 地 址 ， 然后 会 对 输入 流 的 每 
一 行 执行 编辑 命 舍 。 最 简单 的 地 址 形式 是 一 个 行 号 。 我 们 能 够 添加 一 个 地 址 到 我 们 例子 中 : 


[me@linuxbox ~]$ echo "front" | sed '1s/front/back/' 
back 


给 我 们 的 命令 添加 地 址 1， 就 导致 只 对 仅 有 一 行文 本 的 输入 流 的 第 一 行 执行 蔡 换 操作 。 如 果 我 们 指定 另 一 个 数字 : 


[me@linuxbox ~]$ echo "front" | sed '2s/front/back/' 
front 


我 们 看 到 没有 执行 这 个 编辑 命 售 ， 因 为 我 们 的 输入 流 没有 第 二 行 。 地 址 可 以 用 许多 方式 来 表达 。 这 里 是 最 常用 的 : 


表 21-7: sed 地 址 表示 法 
地 址 说 明 


n 行 号 ，n 是 一 个 正 整 数 。 
$ 最 后 一 行 。 

所 有 匹配 一 个 POSIX 基本 正则 表达 式 的 文本 行 。 注 意 正 则 表达 式 通过 斜 杠 字符 界定 。 
/regexp/ 选择 性 地 ， 这 个 正则 表达 式 可 能 由 一 个 各 用 字符 界定 ， 通 过 \cregexpc 来 指定 表达 式 ， 


这 里 c 就 是 一 个 各 用 的 字符 。 
从 addr1 到 addr2 范围 内 的 文本 行 ， 包 含 地址 addr2 在 内 。 地 址 可 能 是 上 述 任意 单独 


addr1,addr2 的 地 址 形式 

ee 匹配 由 数字 first 代表 的 文本 行 ， 然 后 随后 的 每 个 在 step 间隔 处 的 文本 行 。 例 如 1~2 是 
p 指 每 个 位 于 偶数 行 号 的 文本 行 ，5~5 则 指 第 五 行 和 之 后 每 五 行 位 置 的 文本 行 。 

addr1,+n 匹配 地 址 addr1 和 随后 的 n 个 文本 行 。 

addr! 匹配 所 有 的 文本 行 ， 除 了 addr 之 外 ，addr 可 能 是 上 述 任意 的 地 址 形式 。 


通过 使 用 这 一 章 中 早 前 的 distros.txt 文件 ， 我 们 将 演示 不 同 种 类 的 地 址 表示 法 。 首 先 ， 一 系列 行 号 : 


[me@linuxbox ~]$ sed -n '1,5p' distros.txt 


SSE O02 12/07/2006 
Fedora 10 11/25/2008 
SUSE 1 06/19/2008 
Ubuntu 8.04 04/24/2008 
Fedora 8 11/08/2007 


在 这 个 例子 中 ， 我 们 打印 出 一 系列 的 文本 行 ， 开 始 于 第 一 行 ， 直 到 第 五 行 。 为 此 ， 我 们 使 用 p 命令 ， 其 就 是 简单 地 把 匹配 的 
文本 行 打印 出 来 。 然 而 为 了 高 效 ， 我 们 必须 包含 选项 -n (不 自动 打印 选项 ) ， 让 sed 不 要 默认 地 打印 每 一 行 。 


下 一 步 ， 我 们 将 试用 一 下 正则 表达 式 : 


[me@linuxbox ~]$ sed -n VSUSE/p' distros.txt 


SUSE 10:20 12/07/2006 
SUSE 11.0 06/19/2008 
SUSE: 10.3 10/04/2007 


SWSE LO0:T9N OD/LLI2006 


通过 包含 由 斜 杠 界定 的 正则 表达 式 VSUSEV， 我 们 能 够 孤立 出 包含 它 的 文本 行 ， 和 grep 程序 的 功能 是 相同 的 。 


最 后 ， 我 们 将 试 着 否定 上 面 的 操作 ， 通 过 给 这 个 地 址 添加 一 个 感叹 号 : 


[me@linuxbox ~]$ sed -n VSUSE/p' distros.txt 


Fedora 
Ubuntu 
Fedora 
Ubuntu 
Fedora 
Ubuntu 
Ubuntu 
Fedora 
Fedora 
Ubuntu 
Ubuntu 
Fedora 


U0) 
8.04 
8 
6.10 
思 
T3100 
7.04 


11/25/2008 
04/24/2008 
11/08/2007 
10/26/2006 
05/31/2007 
10/18/2007 
04/19/2007 
10/24/2006 
05/13/2008 
06/01/2006 
10/30/2008 
03/20/2006 


这 里 我 们 看 到 期 望 的 结果 : 输出 了 文件 中 所 有 的 文本 行 ， 除 了 那些 匹配 这 个 正则 表达 式 的 文本 行 。 





人 


全 
了 分 


s/regexp/replacement/ 


y/set1/set2 





到 目前 为 止 ， 这 个 s 


目前 为 止 ， 我 们 已 经 知道 了 两 个 sed 的 编辑 命令 ，s 和 p。 这 里 是 一 个 更 加 全 面 的 基本 编辑 命令 列表 : 


表 21-8 : sed 基本 编辑 命 全 
说 明 
输出 当前 的 行 号 。 
在 当前 行 之 后 追加 文本 。 
删除 当前 行 。 
在 当前 行 之 前 插入 文本 。 


打印 当前 行 。 默 认 情况 下 ，sed 程序 打印 每 一 行 ， 并 且 只 是 编辑 文件 中 匹配 指定 地 址 的 
文本 行 。 通 过 指定 -n 选项 ， 这 个 默认 的 行为 能 够 被 忽略 。 


退出 sed， 不 再 处 理 更 多 的 文本 行 。 如 果 不 指 定 -n 选项 ， 输 出 当前 行 。 
退出 sed， 不 再 处 理 更 多 的 文本 行 。 


只 要 找到 一 个 regexp 匹配 项 ， 就 替换 为 replacement 的 内 容 。 replacement 可 能 包括 

特殊 字符 &， 其 等 价 于 由 regexp 匹配 的 文本 。 另 外 ，replacement 可 能 包含 序列 \1 到 

\9， 其 是 regexp 中 相对 应 的 子 表 达 式 的 内 容 。 更 多 信息 ， 查 看 下 面 back references 部 

a 在 replacement 末尾 的 斜 杠 之 后 ， 可 以 指定 一 个 可 选 的 标志 ， 来 修改 s 命令 
行为 。 


执行 字符 转 写 操作 ， 通 过 把 set1 中 的 字符 转变 为 相对 应 的 set2 中 的 字符 。 注意 不 同 于 
tr 程序，sed 要 求 两 个 字符 集合 具有 相同 的 长 度 。 


命令 是 最 常 使 用 的 编辑 命令 。 我 们 将 仅仅 演示 一 些 它 的 功能 ， 通 过 编辑 我 们 的 distros.txt 文件 。 我 们 以 
前 讨论 过 distros.txt 文件 中 的 日 期 字段 不 是 “友好 地 计算 机 "模式 。 文件 中 的 日 期 格式 是 MM/DD/YYYY， 但 如 果 格 式 是 YYYY- 
MM-DD 会 更 好 一 些 (利于 排序 ) 。 手 动 修 改 日 期 格式 不 仅 浪费 时 间 而 且 易 出 错 ， 但 是 有 了 sed， 只 需 一 步 就 能 完成 修改 : 


[me@linuxbox ~]$ sed 's\([0-9]\{2\})WA([0-9]\{2\})WA([0-9]\{4\}\) $A3-\1-\2/' distros.txt 


SUSE 
Fedora 
SUSE 
Ubuntu 
Fedora 
SUSE 
Ubuntu 
Fedora 
Ubuntu 
Ubuntu 
SUSE 
Fedora 
Fedora 
Ubuntu 
Ubuntu 
Fedora 


02 
10 
LA 
8.04 
8 
103 
6.10 
尼 
了 
7.04 
1 


2006-12-07 
2008-11-25 
2008-06-19 
2008-04-24 
2007-11-08 
2007-10-04 
2006-10-26 
2007-05-31 
2007-10-18 
2007-04-19 
2006-05-11 
2006-10-24 
2008-05-13 
2006-06-01 
2008-10-30 
2006-03-20 


哇 ! 这 个 命 舍 看 起 来 很 匡 陋 。 但 是 它 起 作用 了 。 仅 用 一 步 ， 我 们 就 更 改 了 文件 中 的 日 期 格式 。 它 也 是 一 个 关于 为 什么 有 时 候 
会 开玩笑 地 把 正则 表达 式 称 为 是 “只 写 " 媒 介 的 完美 的 例子 。 我 们 能 写 正 则 表达 式 ， 但 是 有 时 候 我 们 不 能 读 它 们 。 在 我 们 恐惧 
地 忍 不 住 要 逃离 此 命令 之 前 ， 让 我 们 看 一 下 怎样 来 构建 它 。 首 先 ， 我 们 知道 此 命令 有 这 样 一 个 基本 的 结构 : 


sed 's/regexp/replacement/' distros.txt 


我 们 下 一 步 是 要 弄 明白 一 个 正则 表达 式 将 要 孤立 出 日 期 。 因 为 日 期 是 MM/DD/YYYY 格式 ， 并 且 出 现在 文本 行 的 末尾 ， 我 们 
可 以 使 用 这 样 的 表达 式 : 


[0-9]{2}/[0-9]{2}/[0-9]{4}$ 


此 表达 式 匹 配 两 位 数字 ， 一 个 斜 枉 ， 两 位 数字 ， 一 个 斜 枉 ， 四 位 数字 ， 以 及 行 尾 。 如 此 关心 regexp， 那么 replacement 又 
怎样 呢 ? 为 了 解决 此 问题 ， 我 们 必须 介绍 一 个 正则 表达 式 的 新 功能 ， 它 出 现 在 一 些 使 用 BRE 的 应 用 程序 中 。 这 个 功能 叫做 
首 参 照 ， 像 这 样 工 作 : 如 果 序 列 \n 出 现在 replacement 中 ， 这 里 n 是 指 从 1 到 9 的 数字 ， 则 这 个 序列 指 的 是 在 前 面 正 则 表 
达 式 中 相对 应 的 子 表达 式 。 为 了 创建 这 个 子 表达 式 ， 我 们 简单 地 把 它们 用 圆 括号 括 起 来 ， 像 这 样 : 


([0-9]{2})/([0-9]{2})/([0-9]{4})$ 


现在 我 们 有 了 三 个 子 表达 式 。 第 一 个 表达 式 包 含 月 份 ， 第 二 个 包含 某 月 中 的 某 天 ， 以 及 第 三 个 包含 年 份 。 现在 我 们 就 可 以 构 
建 replacement ， 如 下 所 示 : 


NS V2 


此 表达 式 给 出 了 年 份 ， 一 个 斜 枉 ， 月 份 ， 一 个 斜 枉 ， 和 某 天 。 


sed 's/([0-9]{2})/([0-9] {2})/([0-9] {4})$A3-\1-\2/' distros.txt 


我 们 还 有 两 个 问题 。 第 一 个 是 在 我 们 表达 式 中 额外 的 斜 杠 将 会 迷惑 Sed， 当 sed 试图 解释 这 个 s 命令 的 时 候 。 第 二 个 是 因为 
sed， 默 认 情况 下 ， 只 接受 基本 的 正则 表达 式 ， 在 表达 式 中 的 几 个 字符 会 被 当 作文 字 字面 值 ， 而 不 是 元 字符 。 我 们 能 够 解决 
这 两 个 问题 ， 通 过 反 斜 杠 的 自由 应 用 来 转 义 今 人 不 快 的 字符 : 


sed 'sA([0-9]\{2\})W([0-9]\{2\})W([O0-9]\{4\}\) $A3-\1-\2/ distros.txt 


你 掌握 了 吧 ! 
s 命令 的 另 一 个 功能 是 使 用 可 选 标志 ， 其 跟随 替代 字符 串 。 一 个 最 重要 的 可 选 标志 是 g 标志 ， 其 指示 sed 对 某 个 文本 行 全 范 
围 地 执行 查找 和 蔡 代 操作 ， 不 仅仅 是 对 第 一 个 实例 ， 这 是 默认 行为 。 这 里 有 个 例子 : 


[me@linuxbox ~]$ echo "aaabbbccc" | sed 's/b/B/' 
aaaBbbccc 


我 们 看 到 虽然 执行 了 蔡 换 操作 ， 但 是 只 针对 第 一 个 字母 “b” 实例 ， 然 而 剩余 的 实例 没有 更 改 。 通 过 添加 g 标志 ， 我 们 能 够 更 
改 所 有 的 实例 : 


[me@linuxbox ~]$ echo "aaabbbccc" | sed 's/b/B/g' 
aaaBBBccc 





目前 为 止 ， 通 过 命 邻 行 我 们 只 让 sed 执行 单个 命令 。 使 用 -选项 ， 也 有 可 能 在 一 个 脚本 文件 中 构建 更 加 复 条 的 命令 。 为 了 演 


示 ， 我 们 将 使 用 sed 和 distros.txt 文件 来 生成 一 个 报告 。 我 们 的 报告 以 开头 标题 ， 修 改过 的 日 期 ， 以 及 大 写 的 发 行 版 名 称 为 
特征 。 为 此 ， 我 们 需要 编写 一 个 脚本 ， 所 以 我 们 将 打开 文本 编辑 器 ， 然 后 输入 以 下 文字 : 


# sed script to produce Linux distributions report 

RN 

RN 

Linux Distributions Report\ 
sA([O-9]\{2\})WA(LO-9]\{2\7)WA(LO-9]\{4\}) $A3A1-\2/ 
y/abcdefghijkImnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/ 


我 们 将 把 sed 脚本 保存 为 distros.sed 文件 ， 然 后 像 这 样 运行 它 : 


[me@linuxbox ~]$ sed -f distros.sed distros.txt 
Linux Distributions Report 
SUSE 10.2 2006-12-07 
FEDORA 10 2008-11-25 
SUSE 11.0 2008-06-19 
UBUNTU 8.04 2008-04-24 
FEDORA 8 2007-11-08 
SUSE 10.3 2007-10-04 
UBUNTU 6.10 2006-10-26 
FEDORA 7 2007-05-31 
UBUNTU 7.10 2007-10-18 
UBUNTU 7.04 2007-04-19 
SUSE 10.1 2006-05-11 
FEDORA 6 2006-10-24 
FEDORA 9 2008-05-13 





正如 我 们 所 见 ， 我 们 的 脚本 文件 产生 了 期 望 的 结果 ， 但 是 它 是 如 何 做 到 的 呢 ? 让 我 们 再 看 一 下 我 们 的 脚本 文件 。 我 们 将 使 用 
cat 来 给 每 行文 本 编号 : 


[me@linuxbox ~]$ cat -n distros.sed 

1# sed script to produce Linux distributions report 

这 

SN 

4\ 

5 Linux Distributions Report\ 

6 

7 sA([0-9]\{2\} WA([O0-9]\{2\})W(LO-9]\{4\}V)$A3-\1-\2/ 

8 y/abcdefghijklImnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/ 


我 们 脚本 文件 的 第 一 行 是 一 条 注释 。 如 同 Linux 系统 中 的 许多 配置 文件 和 编程 语言 一 样 ， 注 释 以 # 字 符 开始 ， 然后 是 人 类 可 
读 的 文本 。 注 释 可 以 被 放 到 脚本 中 的 任意 地 方 (虽然 不 在 命 合 本 身 之 中 ) ， 且 对 任何 可 能 需要 理解 和 二 或 维护 脚本 的 人 们 都 
很 有 帮助 。 


第 二 行 是 一 个 空 行 。 正 如 注释 一 样 ， 添 加 空白 行 是 为 了 提高 程序 的 可 读 性 。 


许多 sed 命令 支持 行 地 址 。 这 些 行 地 址 被 用 来 指定 对 输入 文本 的 哪 一 行 执行 操作 。 行 地 址 可 能 被 表示 为 单独 的 行 号 ， 行 号 范 
围 ， 以 及 特殊 的 行 号 "$"， 它 表示 输入 文本 的 最 后 一 行 。 


从 第 三 行 到 第 六 行 所 包含 地 文本 要 被 插入 到 地 址 1 处 ， 也 就 是 输入 文本 的 第 一 行 中 。 这 个 i 命令 之 后 是 反 斜 杠 回 车 符 ， 来 产 
生 一 个 转 义 的 回 车 符 ， 或 者 就 是 所 谓 的 连 行 符 。 这 个 序列 能 够 被 用 在 许多 环境 下 ， 包 括 shell 脚本 ， 从 而 允许 把 回 车 符 谋 入 
到 文本 流 中 ， 而 没有 通知 解释 器 (在 这 是 指 sed 解释 器 ) 已 经 到 达 了 文本 行 的 末尾 。 这 个 i 命令 ， 同 样 地 ， 命 令 a (追加 文 
本 ， 而 不 是 插入 文本 ) 和 c 《取代 文本 ) 命令 都 多 许多 个 文本 行 ， 只 要 每 个 文本 行 ， 除 了 最 后 一 行 ， 以 一 个 连 行 符 结束 。 实 
际 上 ， 脚 本 的 第 六 行 是 插入 文本 的 末尾 ， 它 以 一 个 普通 的 回 车 符 结尾 ， 而 不 是 一 个 连 行 符 ， 通 知 解释 器 i 命令 结束 了 。 








注意 : 一 个 连 行 符 由 一 个 斜 杠 字符 其 后 紧 跟 一 个 回 车 符 组 成 。 它 们 之 间 不 允许 有 空白 字符 。 


第 七 行 是 我 们 的 查找 和 替代 命令 。 因 为 命令 之 前 没有 添加 地 址 ， 所 以 输入 流 中 的 每 一 行文 本 都 得 服从 它 的 操作 。 


第 八 行 执 行 小 写字 母 到 大 写字 母 的 字符 替换 操作 。 注 意 不 同 于 tr 命令 ， 这 个 sed 中 的 y 命令 不 支持 字符 区 域 (例如 ，[a- 
z]) ， 也 不 支持 POSIX 字符 集 。 再 说 一 次 ， 因 为 y 命令 之 前 不 带 地 址 ， 所 以 它 会 操作 输入 流 的 每 一 行 。 


喜欢 sed 的 人 们 也 会 喜欢 。。。 


sed 是 一 款 非 常 强大 的 程序 ， 它 能 够 针对 文本 流 完成 相当 复 厅 的 编辑 任务 。 它 最 常 用 于 简单 的 行 任务 ， 而 不 是 长 长 的 
脚本 。 许 多 用 户 喜欢 使 用 其 它 工 具 ， 来 执行 较 大 的 工作 。 在 这 些 工 具 中 最 著名 的 是 awk 和 perl。 它 们 不 仅仅 是 工具 ， 
像 这 里 介绍 的 程序 ， 且 延伸 到 完整 的 编程 语言 领域 。 特 别 是 perl， 经 常 被 用 来 代替 shell 脚本 ， 来 完成 许多 系统 管理 
任务 ， 同时 它 也 是 一 款 非常 流行 网 络 开 发 语言 。awk 更 专用 一 些 。 其 具体 优点 是 其 操作 表格 数据 的 能 力 。 awk 程序 通 
常 逐 行 处 理 文本 文件 ， 这 点 类 似 于 sed，awk 使 用 了 一 种 方案 ， 其 与 sed 中 地 址 之 后 跟随 编辑 命令 的 概念 相似 。 虽然 
关于 awk 和 perl 的 内 容 都 超出 了 本 书 所 讨论 的 范围 ， 但 是 对 于 Linux 命令 行 用 户 来 说 ， 它 们 都 是 非常 好 的 技能 。 

































































我 们 要 查看 的 最 后 一 个 工具 是 aspell， 一 款 交 互 式 的 拼写 检查 器 。 这 个 aspell 程序 是 早先 ispell 程序 的 继承 者 ， 大 多 数 情况 
下 ， 它 可 以 被 用 做 一 个 替代 品 。 虽 然 aspell 程序 大 多 被 其 它 需 要 拼写 检查 能 力 的 程序 使 用 ， 但 它 也 可 以 作为 一 个 独立 的 命令 
行 工 具 使 用 。 它 能 够 智能 地 检查 各 种 类 型 的 文本 文件 ， 包括 HTML 文件 ，C/C++ 程序 ， 电 子 邮 件 和 其 它 种 类 的 专业 文本 。 


拼写 检查 一 个 包含 简单 的 文本 文件 ， 可 以 这 样 使 用 aspell: 


aspell check textfile 


这 里 的 textfile 是 要 检查 的 文件 名 。 作 为 一 个 实际 例子 ， 让 我 们 创建 一 个 简单 的 文本 文件 ， 叫 做 foo.txt， 包含 一 些 故意 的 拼写 


错误 : 


[me@linuxbox ~]$ cat > foo.txt 
The quick brown fox jimped over the laxy dog. 


下 一 步 我 们 将 使 用 aspell 来 检查 文件 : 


[me@linuxbox ~]$ aspell check foo.txt 





因为 aspell 在 检查 模式 下 是 交互 的 ， 我 们 将 看 到 像 这 样 的 一 个 屏幕 : 


The quick brown fox jimped over the laxy dog. 


1)jumped 6)wimped 
2)gimped 7)camped 
3)comped 8)humped 
4)limped 9)impede 
5)pimped 0)umped 
i)lgnore Il)lgnore all 
r)Replace R)Replace all 
a)Add DAdd Lower 
b)Abort x)Exit 

3 


在 显示 屏 的 顶部， 我 们 看 到 我 们 的 文本 中 有 一 个 拼写 可 疑 且 高 亮 显示 的 单词 。 在 中 间 部 分 ， 我 们 看 到 十 个 拼写 建议 ， 序 号 从 
0 到 9， 然 后 是 一 系列 其 它 可 能 的 操作 。 最 后 ， 在 最 底部 ， 我 们 看 到 一 个 提示 符 ， 准备 接受 我 们 的 选择 。 


如 果 我 们 按 下 1 按键 ，aspell 会 用 单词 jumped 代替 错误 单词 ， 然 后 移动 到 下 一 个 拼写 错 的 单词 ， 就 是 laxy。 如 果 我 们 选择 


替代 物 lazy，aspell 会 替换 laxy 并 且 终 止 。 一 旦 aspell 结束 操作 ， 我 们 可 以 检查 我 们 的 文件 ， 会 看 到 拼写 错误 的 单词 已 经 
更 正 了 。 


[me@linuxbox ~]$ cat foo.txt 
The quick brown foxjumped over the lazy dog. 


除非 由 命令 行 选项 --dont-backup 告诉 aspell， 和 否则 通过 追加 扩展 名 .bak 到 文件 名 中 , aspell 会 创建 一 个 包含 原始 文本 的 各 


份 文件 。 


为 了 炫耀 sed 的 编辑 本 领 ， 我 们 将 还 原 拼写 错误 ， 从 而 能 够 重用 我 们 的 文件 : 


[me@linuxbox ~]$ sed -i 's/lazy/laxy/; s/jumped/jimped/' foo.txt 


这 个 sed 选项 -i， 告 诉 sed 在 适当 位 置 编 辑 文件 ， 意 思 是 不 要 把 编辑 结果 发 送 到 标准 输出 中 。sed 会 把 更 改 应 用 到 文件 中 
以 此 重新 编写 文件 。 我 们 也 看 到 可 以 把 多 个 sed 编辑 命令 放 在 同一 行 ， 编 辑 命令 之 间 由 分 号 分 隅 开 来 。 


下 一 步 ， 我 们 将 看 一 下 aspell 怎样 来 解决 不 同 种 类 的 文本 文件 。 使 用 一 个 文本 编辑 器 ， 例 如 vim ( 胆 大 的 人 可 能 想 用 
sed) ， 我 们 将 添加 一 些 HTML 标志 到 文件 中 : 


<html> 
<head> 
<title>Mispelled HTML file</title> 
</head> 
<body> 
<p>The quick brown fox jimped over the laxy dog.</p> 
</body> 
</html> 


现在 ， 如 果 我 们 试图 拼写 检查 我 们 修改 的 文件 ， 我 们 会 遇 到 一 个 问题 。 如 果 我 们 这 样 做 : 


[me@linuxbox ~]$ aspell check foo.txt 


我 们 会 得 到 这 些 : 
<html> 
<head> 
<title>Mispelled HTML file</title> 
</head> 
<body> 
<p>The quick brown fox jimped over the laxy dog.</p> 
</body> 
</html> 
1) HTML 4) Hamel 
2) ht ml 5) Hamil 
3) ht-ml 6) hotel 
i) lgnore 1) lgnore all 
r) Replace R) Replace all 
a) Add 1) Add Lower 
b) Abort x) Exit 


和 


aspell 会 认为 HTML 标志 的 内 容 是 拼写 错误 。 通 过 包含 -H (HTML) 检查 模式 选项 ， 这 个 问题 能 够 解决 ， 像 这 样 : 


[me@linuxbox ~]$ aspell -H check foo.txt 


这 会 导致 这 样 的 结果 : 


<html> 


<head> 
<title><b>Mispelled</b> HTML file</title> 
</head> 
<body> 
<p>The quick brown fox jimped over the laxy dog.</p> 
</body> 
</html> 
1) HTML 4) Hamel 
2) ht ml 5) Hamil 
3) ht-ml 6) hotel 
i) lgnore 1) lgnore all 
r) Replace R) Replace all 
a) Add 1) Add Lower 
b) Abort x) Exit 


@ 


es 


这 个 HTML 标志 被 忽略 了 ， 并 且 只 会 检查 文件 中 非 标志 部 分 的 内 容 。 在 这 种 模式 下 ，HTML 标志 的 内 容 被 忽略 了 ， 不 会 进行 
拼写 检查 。 然 而 ，ALT 标志 的 内 容 ， 会 被 检查 。 


注意 : 默认 情况 下 ，aspell 会 忽略 文本 中 URL 和 电子 邮件 地 址 。 通 过 命令 行 选项 ， 可 以 重 写 此 行为 。 也 有 可 能 指定 哪些 标 
志 进 行 检 查 及 跳 过 。 详 细 内 容 查看 aspell 命令 手册 。 


在 这 一 章 中 ， 我 们 已 经 查看 了 一 些 操作 文本 的 命令 行 工 具 。 在 下 一 章 中 ， 我 们 会 再 看 几 个 命令 行 工具 。 诚然 ， 看 起 来 不 能 立 
即 显 现 出 怎样 或 为 什么 你 可 能 使 用 这 些 工具 为 日 常 的 基本 工具 ， 虽然 我 们 已 经 展示 了 一 些 半 实际 的 命令 用 法 的 例子 。 我 们 将 
在 随后 的 章节 中 发 现 这 些 工具 组 成 了 解决 实际 问题 的 基本 工具 箱 。 这 将 是 确定 无 疑 的 ， 当 我 们 学 习 shell 脚本 的 时 候 ， 到 时 
候 这 些 工 具 将 真正 体现 出 它们 的 价值 。 


拓展 阅读 
GNU 项 目 网 站 包含 了 本 章 中 所 讨论 工具 的 许多 在 线 指南 。 

e 来 自 Coreutils 软件 包 : 
http://www.gnu.org/software/coreutils/manual/coreutils.html#Output-of-entire-files 
http:/www.gnu.org/software/coreutils/manual/coreutils.html#Operating-on-sorted-files 
http://www.gnu.org/software/coreutils/manual/coreutils.html#Operating-on-fields-within-a-line 
http:/www.gnu.org/software/coreutils/manual/coreutils.html#Operating-on-characters 

e。 来 自 Diffutils 软件 包 : 
http:/www.gnu.org/software/diffutils/manual/html_mono/diff.html 

e@ sed 
http:/www.gnu.org/software/sed/manual/sed.html 

e@ aspell 
http://aspell.net/man-html/index.html 

e There are many other online resources for sed, in particular: 


http:/www.grymoire.com/Unix/Sed.html 


http://sed.sourceforge.net/sed1line .txt 
e。 也 试 着 搜索 一 下 “sed one liners”, “sed cheat sheets” 
友情 提示 


有 一 些 更 有 趣 的 文本 操作 命 邻 值得。 在 它们 之 间 有 : split (把 文件 分 割 成 碎片 )， csplit (基于 上 下 文 把 文件 分 割 成 碎片 ) ， 
和 sdiff (并 排 合并 文件 差异 ) 。 


格式 化 输出 


在 这 章 中 ， 我 们 继续 着 手 于 文本 相关 的 工具 ， 关 注 那 些 用 来 格式 化 输出 的 程序 ， 而 不 是 改变 文本 自身 。 这 些 工具 通常 让 文本 
准备 就 绪 打 印 ， 这 是 我 们 在 下 一 章 会 提 到 的 。 我 们 在 这 章 中 会 提 到 的 工具 有 : 


e。 nl 一 添加 行 

e fold - 限制 文件 列 宽 

e。 fmt 一 一 个 简单 的 文本 格式 转换 器 
。 pr 一 让 文本 为 打印 做 好 准备 
eprintf 一 格式 化 数据 并 打印 出 来 
e groff 一 一 个 文件 格式 系统 
简单 的 格式 化 工具 


na 些 简单 的 格式 工具 。 他 们 都 是 功能 单一 的 程序 ， 并 且 做 法 有 一 点 单纯 ， 但 是 他 们 能 被 用 于 小 任务 并 且 作 为 
脚本 和 管道 的 一 部 分 。 


一 添加 行 号 


nl 程序 是 一 个 相当 神秘 的 工具 ， 用 作 一 个 简单 的 任务 。 它 添加 文件 的 行 数 。 在 它 最 简单 的 用 途中 ， 它 相当 于 cat -n: 


[me@linuxbox ~]$ nl distros.txt | head 


像 cat，nl 既 能 接受 多 个 文件 作为 命令 行 参数 ， 也 能 标准 输出 。 然 而 ，nl 有 一 个 相当 数量 的 选项 并 支持 一 个 简单 的 标记 方式 
去 允许 更 多 复杂 的 方式 的 计算 。 





nl 在 计算 文件 行 数 的 时 候 支 持 一 个 叫 “ 远 辑 页 面 "的 概念 。 这 人 允许 nl 在 计算 的 时 候 去 重 设 (再 一 次 开始 ) 可 数 的 序列 。 用 到 那 
些 选项 的 时 候 ， 可 以 设置 一 个 特殊 的 开始 值 ， 并 且 在 某 个 可 限定 的 程度 上 还 能 设置 它 的 格式 。 一 个 逻辑 页 面 被 进一步 分 为 
header, Oe 和 footer 这 样 的 元 素 。 在 每 一 个 部 分 中 ， 数 行 数 可 以 被 重 设 ， 并 且 / 或 被 设置 成 另外 一 个 格式 。 如 果 nIl 同 时 处 理 
多 个 文件 ， 它 会 把 他 们 当成 一 个 单一 的 文本 流 。 文 本 流 中 的 部 分 被 一 些 相当 古 怪 的 标记 的 存在 加 进 了 文本 : 





每 一 个 上 述 的 标记 元 素 肯 定 在 自己 的 行 中 独自 出 现 。 在 处 理 完 一 个 标记 元 素 之 后 ，n| 把 它 从 文本 流 中 删除 。 
这 里 有 一 些 常用 的 nl 选项 : 


表格 22-2: 常用 nl 选项 


选项 含义 

把 body 按 被 要 求 方式 数 行 ， 可 以 是 以 下 方式 : 
a= 数 所 有 行 
t= 数 非 空 行 。 这 是 默认 设置 。 

-b style 
n= 无 
pregexp = 只 数 那些 匹配 了 正则 表达 式 的 行 

-f style 将 footer 按 被 要 求 设 置 数 。 默 认 是 无 

-h style 将 header 按 被 要 求 设置 数 。 默 认 是 

-inumber 将 页 面 增加 量 设 置 为 数字 。 默 认 是 一 


设置 数 数 的 格式 ， 格 式 可 以 是 : 
In = 左 偏 ， 没 有 前 导 需 。 


-n format 


-pb 
-S String 
-Vv Number 


-WwW width 


rn = 右 偏 ， 没 有 前 导 需 。 


rz = 右 偏 ， 有 前 导 规 。 


不 要 在 没 一 个 逻辑 页 面 的 开始 重 设 页 面 数 。 


在 没 一 个 行 的 末 


将 行 


的 


尾 


加 字符 作 分 割 符号 。 上 默认 是 单个 的 tab。 


的 第 一 行 


设置 成 数字 。 上 默认 是 一 。 


坦诚 的 说 ， 我 们 大 概 不 会 那么 频繁 地 去 数 行 数 ， 但 是 我 们 能 用 nl 去 查看 我 们 怎么 将 多 个 工具 结合 在 一 个 去 完成 更 复杂 的 任 
务 。 我 们 将 在 之 前 章节 的 基础 上 做 一 个 Linux 发 行 版 的 报告 。 因 为 我 们 将 使 用 nl， 包含 它 的 header/body/footer 标记 将 会 
分 有 用 。 我 们 将 把 它 加 到 上 一 章 的 sed 脚本 来 做 这 个 。 使 用 我 们 的 文本 编辑 器 ， 我 们 将 脚本 改 成 一 下 并 且 把 它 保存 成 


distros-nl.sed: 


# sed script to produce Linux distributions report 


TIN 
Na 
RN 


Linux Distributions Report\ 


RN 
Name 


Ver. Released\ 


Ne 


sA([O0-9]\{2\} YW([O-9]\{2\}\) WA(LO-9]\M{ A $A3-\1-\2/ 


$i\ 
NA 
\ 


End Of Report 


这 个 脚本 现在 加 入 了 nl 的 逻辑 页 面 标记 并 且 和 在 报告 的 最 后 加 了 一 个 footer。 记 得 我 们 在 我 们 的 标记 中 必须 两 次 使 用 反 斜 杠 
因为 他 们 通常 被 sed 解释 成 一 个 转 义 字符 。 


下 一 步 ， 我 们 将 结合 sort sed, nl 来 生成 我 们 改进 的 报告 : 


[me@linuxbox ~]$ sort -k 1,1 -k 2n distros.txt | sed -fdistros-nl.sed | nl 


Linux Distributions Report 


Name 
Fedora 
Fedora 
Fedora 
Fedora 
Fedora 
Fedora 
SUSE 
SUSE 
9SUSE 
TOPSUSE 
11 Ubuntu 
12 Ubuntu 
13 Ubuntu 
14 Ubuntu 
15 Ubuntu 


ovOm 上 WwWNP 


Ver. 


OF OO 


9 
10 
TM) 
W082 
L033 
0 
6.06 
Gel 
7.04 
LO 
8.04 


End Of Report 


Released 
2006-03-20 
2006-10-24 
2007-05-31 
2007-11-08 
2008-05-13 

2008-11-25 

2006-05-11 

2006-12-07 

2007-10-04 

2008-06-19 
2006-06-01 
2006-10-26 
2007-04-19 
2007-10-18 
2008-04-24 


我 们 的 报告 是 一 串 命 邻 的 结果 ， 首 先 ， 我 们 给 名 单 按 发 行 版 本 和 版 本 号 (表格 1 和 2 处) 进行 排序 ， 然 后 我 们 用 sed 生产 结 


果 ， 增 加 了 header (包括 了 为 n| 增 加 的 逻辑 页 面 标记 ) 和 footer。 


面 的 body 部 分 的 文本 流 的 行 数 。 


我 们 能 够 重复 命令 并 且 实 验 不 同 的 nl 选项。 一 些 有 趣 的 方式 : 


后 ， 我 们 按 默认 用 nl 生成 了 结果 ， 只 数 了 





属于 逻辑 页 


nl -n rz 


和 


nl -w3-S 


fold - 限制 文件 列 帘 


折 受 是 将 文本 的 行 限制 到 特定 的 宽 的 过 程 。 像 我 们 的 其 他 命令 ，fold 接受 一 个 或 多 个 文件 及 标准 输入 。 如 果 我 们 将 一 个 简单 
的 文本 流 fold， 我 们 可 以 看 到 它 工具 的 方式 : 


[me@linuxbox ~]$ echo "The quick brown foxjumped over the lazy dog." 
| fold -w 12 

The quick br 

own fox jump 

ed over the 

lazy dog. 


这 里 我 们 看 到 了 fold 的 行为 。 这 个 用 echo 命令 发 送 的 文本 用 -w 选项 分 解 成 块 。 在 这 个 例子 中 ， 我 们 设 定 了 行 宽 为 12 个 字 
符 。 如 果 没 有 字符 设置 ， 默 认 是 80。 注 意 到 文本 行 不 会 因为 单词 边界 而 不 会 被 分 解 。 增 加 的 -s 选项 将 让 fold 分 解 到 最 后 可 
用 的 空白 字符， 即 会 考虑 单词 边界 。 


[me@linuxbox ~]$ echo "The quick brown foxjumped over the lazy dog." 
| fold -w 12 -s 

The quick 

brown fox 

jumped over 

the lazy 

dog. 


fmt - 一 个 简单 的 文本 格式 器 


fmt 程 序 同样 折 党 文本 ， 外 加 很 多 功能 它 接 受 文本 或 标准 输入 并 且 在 文本 流 上 呈现 照片 转换 。 基 础 来 说 ， 他 填补 并 且 将 文本 粘 
帖 在 一 起 并 且 保留 了 空白 符 和 缩 进 。 


为 了 解释 ， 我 们 将 需要 一 些 文本 。 让 我 们 抄 一 些 fmt 主页 上 的 未 西 吧 : 


我 们 将 把 这 段 文本 复制 进 我 们 的 文本 编辑 器 并 且 保 存 文件 名 为 fmt-info.txt。 现 在 ， 让 我 们 重新 格式 这 个 文本 并 且 让 它 成 为 一 
个 50 个 字符 宽 的 项 目 。 我 们 能 用 -w 选项 对 文件 进行 处 理 : 


[me@linuxbox ~]$ fmt -w 50 fmt-info.txt | head 
fmt' reads from the specified FILE arguments 

(or standard input if 

none are given), and writes to standard output. 
By default, blank lines, spaces between words, 
and indentation are 

preserved in the output; successive input lines 
with different indentation are not joined; tabs 
are expanded on input and introduced on output. 


好 ， 这 真是 一 个 奇怪 的 结果 。 大 概 我 们 应 该 认真 的 阅读 这 段 文 本 ， 因 为 它 恰好 解释 了 发 生 了 什么 : 


默认 来 说 ， 空 白 行 ， 单 词 间 距 ， 还 有 缩 进 都 会 在 输出 中 保留 ; 持续 输入 不 同 的 缩 进 的 流 不 会 被 结合 ; tabs 被 用 来 扩展 输入 并 
且 引 入 输出 。 


所 以 ，fmt 保留 了 第 一 行 的 缩 进 。 幸 运 的 是 ，fmt 提供 一 个 修正 这 个 的 选项 : 


好 多 了 。 通 过 加 了 -c 选项 ， 我 们 现在 有 了 我 们 想 要 的 结果 。 
fmt 有 一 些 有 趣 的 选项 : 


-p 选项 特别 有 趣 。 通 过 它 ， 我 们 可 以 格式 文件 选中 的 部 分 ， 通 过 在 开头 使 用 一 样 的 符号 。 很 多 编程 语言 使 用 锚 标 记 (#) 去 
提醒 注释 的 开始 ， 而 且 它 可 以 通过 这 个 选项 来 被 格式 。 让 我 们 创建 一 个 有 用 到 注释 的 程序 。 


[me@linuxbox ~]$ cat > fmt-code.txt 

# This file contains code with comments. 
# This line is a comment. 

# Followed by another comment line. 

# And another. 

This, on the other hand, is a line of code. 
And another line of code. 

And another. 


我 们 的 示例 文件 包含 了 用 '#" 开始 的 注释 〈 一 个 # 后 跟着 一 个 空白 符 ) 和 代码 。 现 在 ， 使 用 fmt， 我 们 能 格式 注释 并 且 不 让 
代码 被 触及 。 


打印 


前 几 章 我 们 学 习 了 如 何 操控 文本 ， 下 面 要 做 的 是 将 文本 呈 于 纸 上 。 在 这 章 中 ， 我 们 将 会 着 手 用 于 打印 文件 和 控制 打印 选项 的 
命令 行 工具 。 通 常 不 同 发 行 版 的 打印 配置 各 有 不 同 且 都 会 在 其 安装 时 自动 完成 ， 因 此 这 里 我 们 不 讨论 打印 的 配置 过 程 。 本 章 
的 练习 需要 一 台 正 确 配 置 的 打印 机 来 完成 。 我 们 将 讨论 一 下 命令 : 


e pr 一 一 转换 需要 打印 的 文本 文件 

e lpr 一 一 打印 文件 

e lp 一 一 打印 文件 (System V) 

e a2ps 一 一 为 PostScript 打印 机 格式 化 文件 

e lpstat 一 一 显示 打印 机 状态 信息 

e lpd 一 一 显示 打印 机 队列 状态 

e lprm 一 一 取消 打印 任务 

e。 cancel 一 一 取消 打印 任务 (System V) 
打印 简 史 


为 了 较 好 的 理解 类 Unix 操作 系统 中 的 打印 功能 ， 我 们 必须 先 了 解 一 些 历史 。 类 Unix 系统 中 的 打印 可 追溯 到 操作 系统 本 身 的 
起 源 ， 那 时 候 打 印 机 和 它 的 用 法 与 今天 截然 不 同 。 


早期 的 打印 


和 计算 机 一 样 ， 前 PC 时 代 的 打印 机 都 很 大 、 很 贵 ， 并 且 很 集中 。1980 年 的 计算 机 用 户 都 是 在 离 电脑 很 远 的 地 方 用 一 个 连接 
电脑 的 终端 来 工作 的 ， 而 打印 机 就 放 在 电脑 旁 并 受到 计算 机 管理 员 的 全 方位 监视 。 


由 于 当时 打印 机 既 昂 贵 又 集中 ， 而 且 都 工作 在 早期 的 Unix 环境 下 ， 人 们 从 实际 考虑 通常 都 会 多 人 共享 一 台 打印 机 。 为 了 区 别 
不 同 用 户 的 打印 任务 ， 每 个 打印 任务 的 开头 都 会 打印 一 张 写 着 用 户 名 字 的 标题 页 ， 然 后 计算 机 工作 人 员 会 用 推 车 装 好 当天 的 
打印 任务 并 分 发 给 每 个 用 户 。 


基于 字符 的 打印 机 


80 年 代 的 打印 机 技术 有 两 方面 的 不 同 。 首 先 ， 那 时 的 打印 机 基本 上 都 是 打击 式 打印 机 。 打 击 式 打印 机 使 用 撞 针 打击 色 带 的 机 
械 结构 在 纸 上 形 成 字符 。 这 种 流行 的 技术 造就 了 当时 的 菊 轮 式 打印 和 点 阵 式 打印 。 


其 次 ， 更 重要 的 是 ， 早 期 打印 机 的 特点 是 它 使 用 设 各 内 部 固定 的 一 组 字符 集 。 比 如 ， 一 台 菊 轮 式 打印 机 只 能 打印 固定 在 其 菊 
花 轮 花 办 上 的 字符 ， 就 这 点 而 言 打 印 机 更 像 是 高 速 打字 机 。 大 部 分 打字 机 都 使 用 等 宽 字 体 ， 意 思 是 说 每 个 字符 的 宽度 相等 ， 

页 面 上 只 有 固定 的 区 域 可 供 打印 ， 而 这 些 区 域 只 能 容纳 固定 的 字符 数 。 大 部 分 打印 机 采用 横向 10 字 符 每 英寸 (CPI) 和 纵向 6 
行 每 英寸 (LPI) 的 规格 打印 ， 这 样 一 张 美式 信 片 纸 就 有 横向 85 字 符 宽 纵向 66 行 高 ， 加 上 两 侧 的 页 边 距 ， 一 行 的 最 大 宽度 可 
达 80 字 符 。 据 此 ， 使 用 等 宽 字 体 就 能 提供 所 见 即 所 得 (WYSIWYG，What You See ls What You Get) 的 打印 预览 。 


接着 ， 一 台 类 打字 机 的 打印 机 会 收 到 以 简单 字 节 流 的 形式 传送 来 的 数据 ， 其 中 就 包含 要 打印 的 字符 。 例 如 要 打印 一 个 字母 a， 
计算 机 就 会 发 送 ASCIl 码 97， 如 果 要 移动 打印 机 的 滑动 架 和 纸张 ， 就 需要 使 用 回 车 、 换 行 、 换 页 等 的 小 编号 ASCII 控制 码 。 
使 用 控制 码 ， 还 能 实现 一 些 之 前 受 限 制 的 字体 效果 ， 比 如 粗 体 ， 就 是 让 打印 机 先 打印 一 个 字符 ， 然 后 退 格 再 打印 一 逼 来 得 到 
颜色 较 深 的 效果 的 。 用 nroff 来 产生 一 个 手册 页 然后 用 cat -A 检查 输出 ， 我 们 就 能 亲眼 看 看 这 种 效果 了 : 





[me@linuxbox ~]$ zcat /usrshare/man/manl/ls.1.gz | nroff -man | cat -A | head 
LS(1) User Commands LS(1) 


$ 

$ 

$ 

N^ 人 HNA^ 人 HAM 人 人 HME 人 HE$ 

ls -list directory contents$ 

$ 

S^HSYNHYN^HNO^HOP^HPS^HSI^HIS^HS$ 

EPIlSAElSE NHIOROHPEANES Ee OBINIS I SE EES 


^H (ctrl-H) 字符 是 用 于 打印 粗 体 效果 的 退 格 符 。 同 样 ， 我 们 还 可 以 看 到 用 于 打印 下 划 线 效果 的 [ 退 格 /下 划 线 ] 序 列 。 


图 形 化 打印 机 


图 形 用 户 界面 (GUI) 的 发 展 催生 了 打印 机 技术 中 主要 的 变革 。 随 着 计算 机 的 展现 步 人 更 多 以 图 形 为 基础 的 方式 ， 打 印 技术 
也 从 基于 字符 走向 图 形 化 技术 ， 这 一 切 都 是 源 于 激光 打印 机 的 到 来 ， 它 不 仅 廉价 ， 还 可 以 在 打印 区 域 的 任意 位 置 打印 微小 的 
墨 点 ， 而 不 是 使 用 固定 的 字符 集 。 这 让 打印 机 能 够 打印 成 比例 的 字体 ( 像 用 排 字 机 那样 ) ， 基 至 是 图 片 和 高 质量 图 表 。 然 
而 ， 从 基于 字符 的 方式 到 转移 到 图 形 化 的 方式 提出 了 一 个 严峻 的 技术 挑战 。 原 因 如 下 : 使 用 基于 字符 的 打印 机 时 ， 填 满 一 张 
纸 所 用 的 字 节 数 可 以 这 样 计算 出 来 (假设 一 张 纸 有 60 行 ， 每 行 80 个 字符 ) : 60 x 80 = 4800 字 节 相 比 之 下 ， 用 一 台 300 点 每 
英寸 (DPI) 分 辩 率 的 激光 打印 机 (假设 一 张 纸 有 8 乘 10 英 寸 的 打印 区 域 ) 打印 则 需要 (8 x 300) x (10 x 300) = 8 = 900,000 
字 节 。 当时 许多 慢 速 的 个 人 电脑 网 络 无 法 接受 激光 打印 机 打印 一 页 需要 传输 将 近 1 焰 的 数据 这 一 点 ， 因 此 ， 很 有 必要 发 明 一 
种 更 聪明 的 方法 。 这 种 发 明 便 是 页 面 描述 语言 (PDL) 。PDL 是 一 种 描述 页 面 内 容 的 编程 语言 。 简 单 的 说 就 是 ，“ 到 这 个 地 
方 ， 印 一 个 10 点 大 小 的 黑体 字符 a ， 到 这 个 地 方 .….” 这 样 直到 页 面 上 的 所 有 内 容 都 描述 完了 。 第 一 种 主要 的 PDL 是 Adobe 
系统 开发 的 PostScript， 直 到 今天 ， 这 种 语言 仍 被 广泛 使 用 。PostScript 是 专 为 印刷 各 类 图 形 和 图 像 设 计 的 完整 的 编程 语 
言 ， 它 内 建 支持 35 种 标准 的 高 质量 字体 ， 在 工作 是 还 能 够 接受 其 他 的 字体 定义 。 最 早 ， 对 PostScript 的 支持 是 打印 机 本 身 内 
建 的 。 这 样 传输 数据 的 问题 就 解决 了 。 相 比 基 于 字符 打印 机 的 简单 字 节 流 ， 典 型 的 PostScript 程序 更 为 详细 ， 而 且 比 表示 整 
个 页 面 的 字 节 数 要 小 很 多 。 一 台 PostScript 打印 机 接受 PostScript 程序 作为 输入 。 打 印 机 有 自己 的 处 理 器 和 内 存 (通常 这 让 
打印 机 比 连接 它 的 计算 机 更 为 强大 ) ， 能 执行 一 种 叫做 PostScript 解析 器 的 特殊 程序 用 于 读 取 输 入 的 PostScript 程序 并 生成 
结果 导入 打印 机 的 内 存 ， 这 样 就 形成 了 要 转移 到 纸 上 的 位 (点) 图。 这 种 将 页 面 泻 染 成 大 型 位 图 (bitmap) 的 过 程 有 个 通用 
名 称 作 光栅 图 像 处 理 器 (rasterimage processor) ， 又 叫 RIP。 多 年 之 后 ， 电 脑 和 网 络 都 变 得 更 快 了 。 这 使 得 RIP 技术 从 
打印 机 转移 到 了 主机 上 ， 还 让 高 品质 打印 机 变 得 更 便宜 了 。 现在 的 许多 打印 机 仍 能 接受 基于 字符 的 字 节 流 ， 但 很 多 廉价 的 打 
印 机 却 不 支持 ， 因 为 它们 依赖 于 主机 的 RIP 提供 的 比特 流 来 作为 点 阵 打 印 。 当 然 也 有 不 少 仍旧 是 PostScript 打印 机 。 





在 Linux 下 打印 


当前 Linux 系统 采用 两 套 软件 配合 显示 和 管理 打印 。 第 一 ，CUPS (Common Unix Printing System， 一 般 Unix 打印 系 
统 ) ， 用 于 提供 打印 驱动 和 打印 任务 管理 ; 第 二 ，Ghostscript， 一 种 PostScript 解析 器 ， 作 为 RIP 使 用 。 CUPS 通过 创建 
并 维护 打印 队列 来 管理 打印 机 。 如 前 所 述 ，Unix 下 的 打印 原本 是 设计 成 多 用 户 共 享 中 央 打 印 机 的 管理 模式 的 。 由 于 打印 机 本 
身 比 连接 到 它 的 电脑 要 慢 ， 打 印 系统 就 需要 对 打印 任务 进行 调度 使 其 保持 顺序 。CUPS 还 能 识别 出 不 同类 型 的 数据 (在 合理 
范围 内 ) 并 转换 文件 为 可 打印 的 格式 。 








为 打印 准备 文件 

作为 命令 行 用 户 ， 尽 管 打印 各 种 格式 的 文本 都 能 实现 ， 不 过 打印 最 多 的 ， 还 是 文本 。 

pr 一 一 转换 需要 打印 的 文本 文件 

前 面 的 章节 我 们 也 有 提 到 过 pr 命令 ， 现 在 我 们 来 探讨 一 下 这 条 命令 结合 打印 使 用 的 一 些 选 项 。 我 们 知道 ， 在 打印 的 历史 上 ， 
基于 字符 的 打印 机 便 经 用 过 等 宽 字体 ， 致 使 每 页 只 能 打印 固定 的 行 数 和 字符 数 ， 而 pr 命令 则 能 够 根据 不 同 的 页 导 和 页 边 距 排 
列 文本 使 其 适应 指定 的 纸张 。 表 22-1 总 结 了 最 常用 的 选项 。 


表 22 一 1 : 常用 pr 选项 


选项 描述 
+first[:last] 输出 从 first 到 last (默认 为 最 后 ) 范围 内 的 页 面 。 
-columns 根据 columns 指定 的 列 数 排版 页 面 内 容 。 


-a 默认 多 列 输出 为 垂直 ， 用 -a (across) 可 使 其 水 平 输出 。 


-d 双 空 格 输出 。 


用 format 指定 的 格式 修改 页 眉 中 显示 的 日 期 ， 日 期 命令 中 format 字符 串 的 描述 详 见 参考 手 


册 。 
-f 改 用 换 页 替换 默认 的 回 车 来 分 割 页 面 。 
-h header 在 页 眉 中 部 用 header 参数 替换 打印 文件 的 名 字 。 
-| length 设置 页 长 为 length， 默 认为 66 行 (每 英寸 6 行 的 美国 信纸 ) 。 
-n 输出 行 号 。 
-0 offset 创建 一 个 宽 offset 字符 的 左 页 边 。 
-w width 设置 页 宽 为 width， 默 认为 72 字 符 。 


我 们 通常 用 管道 配合 pr 命 合 来 做 第 选 。 下 面 的 例子 中 我 们 会 列 出 目录 /usr/bin 并 用 pr 将 其 格式 化 为 3 列 输出 的 标题 页 : 


[me@linuxbox ~]$ Is /usr/bin | pr -3 -w 65 | head 


2012-02-18 14:00 Page 1 

[ apturl bsd-write 
41ltoppm ar bsh 

a2p arecord btcflash 
a2ps arecordmidi bug-buddy 
a2ps-lpr-wrapper ark buildhash 


将 打印 任务 送 至 打印 机 


CUPS 打印 体系 支持 两 种 会 用 于 类 Unix 系统 的 打印 方式 。 一 种 ， 叫 Berkeley 或 LPD (用 于 Unix 的 Berkeley 软件 发 行 
版 ) ， 使 用 Ipr 程序 ; 另 一 种 ， 叫 SysV ( 源 自 System V 版 本 的 Unix) ， 使 用 Ip 程序 。 这 两 个 程序 的 功能 大 致 相同 。 具 体 
使 用 哪个 完全 根据 个 人 喜好 。 


ipr 一 一 打印 文件 (Berkeley 风格 ) 


Ipr 程序 可 以 用 来 把 文件 传送 给 打印 机 。 由 于 它 能 接收 标准 输入 ， 所 以 能 用 管道 来 协同 工作 。 例 如 ， 要 打印 刚才 多 列 目录 列表 
的 结果 ， 我 们 只 需 这 样 : 


[me@linuxbox ~]$ Is /usr/bin | pr -3 | Ipr 


报告 会 送 到 系统 默认 的 打印 机 ， 如 果 要 送 到 别 的 打印 机 ， 可 以 使 用 -P 参数 : Ipr -P printer_name printer_name 表示 这 台 打 
印 机 的 名 称 。 若 要 查看 系统 已 知 的 打印 机 列表 : 


[me@linuxbox ~]$ lpstat -a 


注意 : 许多 Linux 发 行 版 允许 你 定义 一 个 输出 PDF 文件 但 不 执行 实体 打印 的 “打印 机 ”， 这 可 以 用 来 很 方便 的 检验 你 的 打印 命 
倒 。 看 看 你 的 打印 机 配置 程序 是 否 支 持 这 项 配置 。 在 某 些 发 行 版 中 ， 你 可 能 要 自己 安装 额外 的 软件 包 (如 cups-pdf) 来 使 用 
这 项 功能 。 


表 22-2 显示 了 lpr 的 一 些 常 用 选项 
表 22 一 2 : 常用 lpr 选项 
-# number 设 定 打印 份 数 为 number。 


p i 时 间 、 工 作 名 称 和 页 码 。 这 种 所 谓 的 “美化 打印 "选项 可 用 于 打印 
文本 文件 。 


-P printer 指定 输出 打印 机 的 名 称 。 未 指定 则 使 用 系统 默认 打印 机 。 


-r 打印 后 删除 文件 。 对 程序 产生 的 临时 打印 文件 较为 有 用 。 


Ip 一 一 打印 文件 (System V 风格 ) 


和 1Ipr 一 样 ，Ip 可 以 接收 文件 或 标准 输入 为 打印 内 容 。 与 Ipr 不 同 的 是 Ip 支持 不 同 的 选项 (略为 复杂 ) ， 表 22-3 列 出 了 其 常 
用 选项 。 


表 22 一 3 : 常用 Ip 选项 


选项 描述 
-d printer 设 定 目标 (打印 机 ) 为 printer。 若 d 选 项 未 指定 ， 则 使 用 系统 默认 打印 机 。 
-nnumber 设 定 的 打印 份 数 为 number。 
-0 landscape 设置 输出 为 横向 。 
-0 fitplot 缩放 文件 以 适应 页 面 。 打 印 图 像 时 较为 有 用 ， 如 JPEG 文件 。 


-0 scaling=number 缩放 文件 至 number。100 表 示 填 满 页 面 ， 小 于 100 表 示 缩 小 ， 大 于 100 则 会 打印 在 多 


页 上 。 
-0 cpi=number 设 定 输出 为 number 字符 每 英寸 ， 默 认为 10。 
-0 lpi=number 设 定 输出 为 number 行 每 英寸 ， 默 认为 6。 


-0 page-bottom=points 

-0 page-left=points Pi em Hj 淄 们 ”一 菇 和 寸 二 
2 设置 页 边 距 ， 单 位 为 点 ， 一 种 印刷 上 的 单位 。 一 英寸 =72 点 。 
-0 page-top=points 


-P pages 指定 打印 的 页 面 。pages 可 以 是 喜 号 分 隔 的 列表 或 范围 一 例如 1,3,5,7-10。 





再 次 打印 我 们 的 目录 列表 ， 这 次 我 们 设置 12 CPI、8 LPI 和 一 个 半 英 寸 的 左边 距 。 注 意 这 里 我 必须 调整 pr 选项 来 适应 新 的 页 
面 大 小 : 








[me@linuxbox ~]$ Is /usr/bin | pr -4 -w 90 -| 88 | Ip -0 page-left=36 -0 cpi=12 -0 lpi=8 


这 条 命令 用 小 于 默认 的 格式 产生 了 一 个 四 列 的 列表 。 增 加 CPI 可 以 让 我 们 在 页 面 上 打印 更 多 列 。 
另 一 种 选择 : a2ps 


a2ps 程序 很 有 趣 。 单 从 名 字 上 看 ， 这 是 个 格式 转换 程序 ， 但 它 的 功能 不 止 于 此 。 程 序 名 字 的 本 意 为 ASCllto PostScript， 它 
是 用 来 为 PostScript 打印 机 准 各 要 打印 的 文本 文件 的 。 多 年 后 ， 程 序 的 功能 得 到 了 提升 ， 名 字 的 含义 也 变 成 了 Anything to 
PostScript。 尽 管 名 为 格式 转换 程序 ， 但 它 实际 的 功能 却 是 打印 。 它 的 默认 输出 不 是 标准 输出 ， 而 是 系统 的 默认 打印 机 。 程 序 
的 默认 行为 被 称 为 "漂亮 的 打印 机 "， 这 意味 着 它 可 以 改善 输出 的 外 观 。 我 们 能 用 程序 在 桌面 上 创建 一 个 PostScript 文件 : 





[me@linuxbox ~]$ Is /usr/bin | pr -3 -t | a2ps -o ~/Desktop/ls.ps -L 66 
[stdin (plain): 11 pages on 6 sheets] 
[Total: 11 pages on 6 sheets] saved into the file ‘/nome/me/Desktop/ls.ps' 


这 里 我 们 用 带 -参数 (忽略 页 看 和 页 脚 ) 的 pr 命令 过 滤 数 据 流 ， 然 后 用 a2ps 指定 一 个 输出 文件 〈-o 参数 ) ， 并 设 定 每 页 66 
行 (-L 参数 ) 来 匹配 pr 的 输出 分 页 。 用 合适 的 文件 查看 器 查看 我 们 的 输出 文件 ， 我 们 就 会 看 到 图 22-1 中 显示 的 结果 。 
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Figure 22-1: Viewing a2ps output 


可 以 看 到 ， 默 认 的 输出 布局 是 一 面 两 页 的 ， 这 将 导致 两 页 的 内 容 被 打印 到 一 张 纸 上 。a2ps 还 能 利用 页 眉 和 页 脚 。 a2ps 有 很 


多 选项 ， 总 结 在 表 22-4 中 。 
选项 

--Center-title text 

--columns number 


--footer text 
--guess 


--left-footer text 
--left-title text 
--line-numbers=interval 


--list=defauls 


--list=topic 


--pages range 
--right-footer text 
--right-title text 
--rows number 
-B 

-b text 


-f size 


-| number 


表 22 一 4 : a2ps 选项 
描 


学 


设置 中 心 页 标题 为 text。 
将 所 有 页 面 排列 成 number 列 ， 默 认为 2。 
设置 页 脚 为 text。 

米 型 | 


报告 参数 中 文件 的 类 型 。 由 于 a2ps 会 转换 并 格式 化 所 有 类 型 的 数据 ， 所 以 当 给 定 文件 
类 型 后 ， 这 个 选项 可 以 很 好 的 用 来 判断 a2ps 应 该 做 什么 。 


设置 左 页 脚 为 text。 


设置 页 面 左 标题 为 text。 

每 隔 interval 行 输出 行 号 。 

显示 默认 设置 。 

显示 topic 设置 ，topic 表示 下 列 之 一 : 代理 程序 (用 来 转换 数据 的 外 部 程序 ) ， 编 码 ， 
特征 ， 变 量 ， 媒 介 (页 面 大 小 等 ) ，ppd (PostScript 打印 机 描述 信息 ) ， 打 印 机 ， 起 始 
程序 (为 常规 输出 添加 前 级 的 代码 部 分 ) ， 样 式 表 ， 或 用 户 选项 。 

打印 range 范围 内 的 页 面 。 

设置 右 页 脚 为 text。 

设置 页 面 右 标题 为 text。 

将 所 有 页 面 排 列 成 number 排 ， 默 认为 1。 

没有 页 眉 。 

设置 页 眉 为 text。 

使 用 字体 大 小 为 Size 号 。 


于 
设置 每 行 字符 数 为 number。 此 项 和 -L 选项 〈 见 下 方 ) 可 以 给 文件 用 其 他 程序 来 更 准确 


的 分 页 ， 如 pr。 


-Lnumber 设置 每 页 行 数 为 number。 

-M name 使 用 打印 媒介 的 名 称 一 例如 ，A4。 

-nnumber 每 页 输出 number 份 。 

-0 file 输出 到 文件 fle。 如 果 指定 为 - ， 则 输出 到 标准 输出 。 

-P printer 使 用 打印 机 printer。 如 果 未 指定 ， 则 使 用 系统 默认 打印 机 。 
-R 纵向 打印 。 

-r 横向 打印 。 

-T number 设置 制 表 位 为 每 number 字符 。 

-Utext 用 text 作为 页 面 底 图 (水印 ) 。 


以 上 只 是 对 a2ps 的 总 结 ， 更 多 的 选项 尚未 列 出 。 


注意 : a2ps 目前 仍 在 不 断 的 开发 中 。 就 我 的 测试 而 言 ， 不 同 版 本 之 间 都 多 少 有 所 变化 。CentOS 4 中 输出 总 是 默认 为 标准 输 
出 。 在 CentOS 4 和 Fedora 10 中 ， 尽 管 程序 配置 信纸 为 默认 媒介 ， 输 出 还 是 默认 为 A4 纸 。 我 可 以 明确 的 指定 需要 的 选项 
来 解决 这 些 问题 。Ubuntu 8.04 中 ，a2ps 表现 的 正如 参考 文档 中 所 述 。 另外 ， 我 们 也 要 注意 到 另 一 个 转换 文本 为 PostScript 
的 输出 格式 化 工具 ， 名 叫 enscript。 它 具有 许多 相同 的 格式 化 和 打印 功能 ， 但 和 a2ps 唯一 的 不 同 在 于 ， 它 只 能 处 理 纯 文本 的 
输入 。 





监视 和 控制 打印 任务 
由 于 Unix 打印 系统 的 设计 是 能 够 处 理 多 用 户 的 多 重 打印 任务 ，CUPS 也 是 如 此 设计 的 。 每 台 打 印 机 都 有 一 个 打印 队列 ， 其 


中 的 任务 直到 传送 到 打印 机 才 停 下 并 进行 打印 。CUPS 支持 一 些 命 合 行 程序 来 管理 打印 机 状态 和 打印 队列 。 想 lpr 和 1p 这 样 
的 管理 程序 都 是 以 Berkeley 和 System V 打印 系统 的 相应 程序 为 依据 进行 排列 的 。 


显示 打印 系统 状态 





lpstat 


lpstat 程序 可 用 于 确定 系统 中 打印 机 的 名 字 和 有 效 性 。 例 如 ， 我 们 系统 中 有 一 台 实 体 打印 机 (名 叫 printer) 和 一 台 PDF 虚拟 
打印 机 (名 叫 PDF) ， 我 们 可 以 像 这 样 查看 打印 机 状态 : 





[me@linuxbox ~]$ lpstat -a 
PDF accepting requests since Mon 05 Dec 2011 03:05:59 PM EST 
printer accepting requests since Tue 21 Feb 2012 08:43:22 AM EST 


接着 ， 我 们 可 以 查看 打印 系统 更 具体 的 配置 信息 : 


[me@linuxbox ~]$ Ipstat -s 

system default destination: printer 

device for PDF: cups-pdf:/ 

device for printer: ipp://print-server:631/printers/printer 


上 例 中 ， 我 们 看 到 printer 是 系统 默认 的 打印 机 ， 其 本 身 是 一 台 网 络 打 印 机 ， 使 用 网 络 打 印 协 议 (ipp://) 通过 网 络 连接 到 名 为 
print-server 的 系统 。 lpstat 的 常用 选项 列 于 表 22-5。 


表 22 一 5 : 常用 1pstat 选项 


选项 描述 
于 en 打印 机 的 队列 。 这 里 显示 的 状态 是 打印 机 队列 承受 任务 的 能 力 ， 而 不 是 实体 打印 机 
状态 。 若 未 指定 打印 机 ， 则 显示 所 有 打印 队列 。 
-d 显示 系统 默认 打印 机 的 名 称 。 
-p [printer...] 显示 printer 指定 的 打印 机 的 状态 。 若 未 指定 打印 机 ， 则 显示 所 有 打印 机 状态 。 


-r 显示 打印 系统 的 状态 。 


t 显示 完整 状态 报告 。 
lpq 一 一 星 示 打印 机 队列 状态 





使 用 Ipq 程序 可 以 查看 打印 机 队列 的 状态 ， 从 中 我 们 可 以 看 到 队列 的 状态 和 所 包含 的 打印 任务 。 下 面 的 例子 显示 了 一 台 名 叫 
printer 的 系统 默认 打印 机 包含 一 个 空 队列 的 情况 : 


[me@linuxbox ~]$ 1Ipq 
printer is ready 
no entries 





如 果 我 们 不 指定 打印 机 (用 -P 参数 ) ， 就 会 显示 系统 默认 打印 机 。 如 果 给 打印 机 添加 一 项 任务 再 查看 队列 ， 我 们 就 会 看 到 下 
列 结果 : 


[me@linuxbox ~]$ ls *.txt | pr -3 | Ip 

request id is printer-603 (1 file(s)) 
[me@linuxbox ~]$ Ipgq 

printer is ready and printing 

Rank Owner Job File(s) Total Size 
active me 603 (stdin) 1024 bytes 





lprm 和 cancel 一 一 取消 打印 任务 

CUPS 提供 两 个 程序 来 从 打印 队列 中 终止 并 移 除 打 印 任务 。 一 个 是 Berkeley 风格 的 (lprm) ， 另 一 个 是 System V 的 
(cancel) 。 在 支持 的 选项 上 两 者 有 较 小 的 区 别 但 是 功能 却 几乎 相同 。 以 上 面 的 打印 任务 为 例 ， 我 们 可 以 像 这 样 终止 并 移 除 

任务 : 


[me@linuxbox ~]$ cancel 603 
[me@linuxbox ~]$ 1Ipq 
printer is ready 

no entries 


每 个 命令 都 有 选项 可 用 于 移 除 某 用 户 、 某 打印 机 或 多 个 任务 号 的 所 有 任务 ， 相 应 的 参考 手册 中 都 有 详细 的 介绍 。 


编译 程序 


在 这 一 章 中 ， 我 们 将 看 一 下 如 何 通 过 编译 源 代码 来 创建 程序 。 源 代码 的 可 用 性 是 至 关 重 要 的 自由 ， 从 而 使 得 Linux 成 为 可 
能 。 整个 Linux 开发 生态 圈 就 是 依赖 于 开发 者 之 间 的 自由 交流 。 对 于 许多 桌面 用 户 来 说 ， 编 译 是 一 种 失传 的 艺术 。 以 前 很 常 
见 ， 但 现在 ， 由 系统 发 行 版 提供 商 维护 巨大 的 预 编译 的 二 进 制 仓库 ， 准 备 供用 户 下 载 和 使 用 。 在 写 这 篇 文章 的 时 候 ， 
Debian 仓库 〈 最 大 的 发 行 版 之 一 ) 包含 了 几乎 23,000 个 预 编译 的 包 。 


那么 为 什么 要 编译 软件 呢 ? 有 两 个 原因 : 


1. 可 用 性 。 尽 管 系 统 发 行 版 仓库 中 已 经 包含 了 大 量 的 预 编译 程序 ， 但 是 一 些 发 行 版 本 不 可 能 包含 所 有 期 望 的 应 用 。 在 这 种 
情况 下 ， 得 到 所 期 望 程序 的 唯一 方式 是 编译 程序 源码 。 


2. 及 时 性 。 虽 然 一 些 系 统 发 行 版 专门 打包 前 治 版 本 的 应 用 程序 ， 但 是 很 多 不 是 。 这 意味 着 ， 为 了 拥有 一 个 最 新 版 本 的 程 
序 ， 编 译 是 必需 的 。 


从 源码 编译 软件 可 以 变 得 非常 复杂 且 有 具有 技术 性 ; 许多 用 户 难以 企及 。 然 而 ， 许 多 编译 任务 是 相当 简单 的 ， 只 涉及 到 几 个 步 
又 。 这 都 取决 于 程序 包 。 我 们 将 看 一 个 非常 简单 的 案例 ， 为 的 是 给 大 家 提供 一 个 对 编译 过 程 的 整体 认识 ， 并 为 那些 愿意 进 一 
步 学 习 的 人 们 构筑 一 个 起 点 。 


我 们 将 介绍 一 个 新 命令 : 

。 make - 维护 程序 的 工具 

什么 是 编译 ? 

简 而 言 之 ， 编 译 就 是 把 源码 (一 个 由 程序 员 编 写 的 人 类 可 读 的 程序 描述 ) 翻译 成 计算 机 处 理 器 的 母语 的 过 程 。 


计算 机 处 理 器 (或 CPU) 工作 在 一 个 非常 基本 的 水 平 ， 执 行 用 机 器 语言 编写 的 程序 。 这 是 一 种 数值 编码 ， 描 述 非常 小 的 操 
作 ， 上 比如 “加 这 个 字 节 ”，“ 指 向 内 存 中 的 这 个 位 置 "， 或 者 “复制 这 个 字 节 ”。 


这 些 指令 中 的 每 一 条 都 是 用 二 进 制 表示 的 (1 和 0) 。 最 早 的 计算 机 程序 就 是 用 这 种 数值 编码 写成 的 ， 这 可 能 就 解释 了 为 什么 
编写 它们 的 程序 员 据 说 吸 很 多 烟 ， 喝 大 量 咖啡 ， 并 带 着 厚 厚 的 眼镜 。 这 个 问题 克服 了 ， 随 着 汇编 语言 的 出 现 ， 汇编 语言 代替 
了 数值 编码 (略微) 简便 地 使 用 助 记 符 ， 比 如 CPY (复制 ) 和 MOV (移动 ) 。 用 汇编 语言 编写 的 程序 通过 汇编 器 处 理 为 机 
器 语言 。 今 天 为 了 完成 某 些 特定 的 程序 任务 ， 汇 编 语言 仍 在 被 使 用 ， 例 如 设备 驱动 和 垦 入 式 系统 。 


下 一 步 我 们 谈论 一 下 什么 是 所 谓 的 高 级 编程 语言 。 之 所 以 这 样 称呼 它们 ， 是 因为 它们 可 以 让 程序 员 少 操心 处 理 器 的 一 举 一 
动 ， 而 更 多 关心 如 何 解决 手头 的 问题 。 早 期 的 高 级 语言 (二 十 世纪 60 年 代 期 间 研发 的 ) 包括 FORTRAN (为 科学 和 技术 问题 
而 设计 ) 和 COBOL (为 商业 应 用 而 设计 ) 。 今 天 这 两 种 语言 仍 在 有 限 的 使 用 。 


虽然 有 许多 流行 的 编程 语言 ， 两 个 占 主导 地 位 。 大 多 数 为 现代 系统 编写 的 程序 ， 要 么 用 C 编写 ， 要 么 是 用 C++ 编写 。 在 随 
后 的 例子 中 ， 我 们 将 编写 一 个 C 程序 。 


用 高 级 语言 编写 的 程序 ， 经 过 另 一 个 称 为 编译 器 的 程序 的 处 理 ， 会 转换 成 机 器 语言 。 一 些 编译 器 把 高 级 指令 翻译 成 汇编 语 
言 ， 然 后 使 用 一 个 汇编 器 完成 翻译 成 机 器 语言 的 最 后 阶段 。 


一 个 称 为 链接 的 过 程 经 常 与 编译 结合 在 一 起 。 有 许多 程序 执行 的 常见 任务 。 以 打开 文件 为 例 。 许 多 程序 执行 这 个 任务 ， 但 是 
让 每 个 程序 实现 它 自己 的 打开 文件 功能 ， 是 很 浪费 资源 的 。 更 有 意义 的 是 ， 拥 有 单独 的 一 段 知道 如 何 打 开 文 件 的 程序 ， 并 人 允 
许 所 有 需要 它 的 程序 共享 它 。 对 常见 任务 提供 支持 由 所 谓 的 库 完成 。 这 些 库 包 含 多 个 程序 ， 每 个 程序 执行 一 些 可 以 由 多 个 程 
序 共享 的 常见 任务 。 如 果 我 们 看 一 下 /lib 和 /uswlib 目录 ， 我 们 可 以 看 到 许多 库 定居 在 那里 。 一 个 叫做 链接 器 的 程序 用 来 在 编 
译 器 的 输出 结果 和 要 编译 的 程序 所 需 的 库 之 间 建 立 连 接 。 这 个 过 程 的 最 终结 果 是 一 个 可 执行 程序 文件 ， 准 各 使 用 。 





所 有 的 程序 都 是 可 编译 的 吗 ? 


不 是 。 正 如 我 们 所 看 到 的 ， 有 些 程序 比如 shell 脚本 就 不 需要 编译 。 它 们 直接 执行 。 这 


些 和 
编写 的 。 近 年 来 ， 这 些 语言 变 得 越 来 越 流 行 ， 包 括 Perl， Python，PHP，Ruby， 和 许多 


旦 序 是 用 所 谓 的 脚本 或 解释 型 语言 
其 它 ; 


语 吾 。 


脚本 语言 由 一 个 叫做 解释 器 的 特殊 程序 执行 。 一 个 解释 器 输入 程序 文件 ， 读 取 并 执行 程序 中 包含 的 每 一 条 指令 。 通常 来 说 ， 


解释 型 程序 执行 起 来 要 比 编译 程序 慢 很 多 。 这 是 因为 每 次 解释 型 程序 执行 时 ， 程 序 中 每 一 条 源码 指令 都 需要 翻译 ， 而 一 个 编 
译 程 序 ， 一 条 源码 指令 只 翻译 一 次 ， 翻 译 后 的 指令 会 永久 地 记录 到 最 终 的 执行 文件 中 。 





ee 原因 是 “足够 快 "” 但 是 真正 的 优势 是 一 般 来 说 开发 解释 型 程序 
要 比 编译 程序 快速 且 容 易 。 通 常 程序 开发 需要 经 历 一 个 不 断 重复 的 写 码 ， 编 译 ， 测 试 周期 。 随 着 程序 变 得 越 来 越 大 ， 编译 阶 
段 会 变 得 相当 耗 时 。 解 释 型 语言 删 0 这 样 就 加 快 了 程序 开发 。 


编译 一 个 C 语言 


让 我 们 编译 一 些 东 西 。 在 我 们 行动 之 前 ， 然 而 我 们 需要 一 些 工 具 ， 像 编译 器 ， 链 接 器 ， 还 有 make。 在 Linux 环境 中 ， 普 通 
使 用 的 C 编译 器 叫做 gcc (GNU C 编译 器 ) ， 最 初 由 Richard Stallman 写 出 来 的 。 大 多 数 Linux 系统 发 行 版 默认 不 安装 
gcc。 我 们 可 以 这 样 查看 该 编译 器 是 否 存在 : 


[me@linuxbox ~]$ which gcc 
/usrbin/gcc 


在 这 个 例子 中 的 输出 结果 表明 安装 了 gcc 编译 器 。 


小 提示 : 你 的 系统 发 行 版 可 能 有 一 个 用 于 软件 开发 的 meta-package (软件 包 的 集合 ) 。 如 果 是 这 样 的 话 ， 考虑 安装 它 ， 若 
你 打算 在 你 的 系统 中 编译 程序 。 若 你 的 系统 没有 提供 一 个 meta-package， 试 着 安装 gcc 和 make 工具 包 。 在 许多 发 行 版 
中 ， 这 就 足够 完成 下 面 的 练习 了 。 


得 到 源码 


为 了 我 们 的 编译 练习 ， 我 们 将 编译 一 个 叫做 diction 的 程序 ， 来 自 GNU 项 目 。 这 是 一 个 小 巧 方便 的 程序 ， 检查 文本 文件 的 书 
写 质 量 和 样式 。 就 程序 而 言 ， 它 相当 小 ， 且 容易 创建 。 


遵照 惯例 ， 首 先 我 们 要 创建 一 个 名 为 src 的 目录 来 存放 我 们 的 源码 ， 然 后 使 用 ftp 协议 把 源码 下 载 下 来 。 


[me@linuxbox ~]$ mkdir src 

[me@linuxbox ~]$ cd src 

[me@linuxbox src]$ ftp ftp.gnu.org 

Connected to ftp.gnu.org. 

220 GNU FTP server ready. 

Name (ftp.gnu.org:me): anonymous 

230 Login successful. 

Remote system type is UNIX. 

Using binary mode to transfer files. 

ftp> cd gnu/diction 

250 Directory successfully changed. 

ftp> ls 

200 PORT command successful. Consider using PASV. 

150 Here comes the directory listing. 

-rw-r--r-- 1 1003 65534 68940 Aug 28 1998 diction-0.7.tar.gz 
-rw-r--r-- 1 1003 65534 90957 Mar 04 2002 diction-1.02.tar.gz 
-rw-r--r-- 1 1003 65534 141062 Sep 17 2007 diction-1.11.tar.gz 
226 Directory send OK. 

ftp> get diction-1.11.tar.gz 

local: diction-1.11.tar.gz remote: diction-1.11.tar.gz 

200 PORT command successful. Consider using PASV. 

150 Opening BINARY mode data connection for diction-1.11.tar.gz 
(141062 bytes). 

226 File send OK. 

141062 bytes received in 0.16 secs (847.4 kB/s) 

ftp> bye 

221 Goodbye. 

[me@linuxbox src]$ 1s 

diction-1.11.tar.gz 





注意 : 因为 我 们 是 这 个 源码 的 “维护 者 "， 当 我 们 编译 它 的 时 候 ， 我 们 把 它 保 存在 ~/src 目录 下 。 由 你 的 系统 发 行 版 源码 会 把 源 
码 安装 在 /usrsrc 目录 下 ， 而 供 多 个 用 户 使 用 的 源码 ， 通 常安 装 在 /usr/local/src 目录 下 。 





正如 我 们 所 看 到 的 ， 通 常 提供 的 源码 形式 是 一 个 压缩 的 tar 文件 。 有 时 候 称 为 tarball， 这 个 文件 包含 源码 树 ， 或 者 是 组 成 源 
码 的 目录 和 文件 的 层次 结构 。 当 到 达 ftp 站 点 之 后 ， 我 们 检查 可 用 的 tar 文件 列表 ， 然 后 选择 最 新 版 本 ， 下 载 。 使 用 ftp 中 的 
get 命令 ， 我 们 把 文件 从 ftp 服务 器 复制 到 本 地 机 器 。 





一 旦 tar 文件 下 载 下 来 之 后 ， 必 须 打 开 。 通 过 tar 程序 可 以 完成 : 


[me@linuxbox src]$ tar xzf diction-1.11.tar.gz 
[me@linuxbox src]$ 1s 

diction-1.11 

diction-1.11.tar.gz 


小 提示 : 该 diction 程序 ， 像 所 有 的 GNU 项 目 软 件 ， 遵 循 着 一 定 的 源码 打包 标准 。 其 它 大 多 数 在 Linux 生态 系统 中 可 用 的 源 
码 也 遵循 这 个 标准 。 该 标准 的 一 个 条 目 是 ， 当 源码 tar 文件 打开 的 时 候 ， 会 创建 一 个 目录 ， 该 目录 包含 了 源码 树 ， 并 且 这 个 
目录 将 会 命名 为 project-x.xXx， 其 包含 了 项 目 名 称 和 它 的 版 本 号 两 项 内 容 。 这 种 方案 能 在 系统 中 方便 安装 同一 程序 的 多 个 版 
本 。 然而 ， 通 常 在 打开 tarball 之 前 检验 源码 树 的 布局 是 个 不 错 的 主意 。 一 些 项 目 不 会 创建 该 目录 ， 反 而 ， 会 把 文件 直接 传递 
给 当前 目录 。 这 会 把 你 的 除非 组 织 良好 的 ) src 目录 弄 得 一 片 狼藉 。 为 了 避免 这 个 ， 使 用 下 面 的 命 售 ， 检 查 tar 文件 的 内 
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检查 源码 树 





打开 该 tar 文件 ， 会 创建 一 个 新 的 目录 ， 名 为 diction-1.11。 这 个 目录 包含 了 源码 树 。 让 我 们 看 一 下 里 面 的 内 容 : 


[me@linuxbox src]$ cd diction-1.11 

[me@linuxbox diction-1.11]$ ls 

config.guess diction.c getopt.c nl 
config.h.in diction.pot getopt.h nl.po 
config.sub diction.spec getopt int.h README 
configure diction.spec.in INSTALL sentence.c 
configure.in diction.texi.in install-sh sentence.h 
COPYING en Makefile.in style.1.in 


de en_GB misc.c style.c 
de.po en_GB.po misc.h test 
diction.1.in getoptl.c NEWS 


在 源码 树 中 ， 我 们 看 到 大 量 的 文件 。 属 于 GNU 项 目的 程序 ， 还 有 其 它 许多 程序 都 会 ， 提 供 文档 文件 
README，INSTALL，NEWS， 和 COPYING。 


这 些 文件 包含 了 程序 描述 ， 如 何 建立 和 安装 它 的 信息 ， 还 有 它 许 可 条 款 。 在 试图 建立 程序 之 前 ， 仔 细 阅 读 README 和 
INSTALL 文件 ， 总 是 一 个 不 错 的 主意 。 





在 这 个 目录 中 ， 其 它 有 趣 的 文件 是 那些 以 .c 和 .h 为 后 级 的 文件 : 


[me@linuxbox diction-1.11]$ 1s *.c 

diction.c getopt1.c getopt.c misc.c sentence.c style.c 
[me@linuxbox diction-1.11]$ 1s *.h 

getopt.h getopt int.h misc.h sentence.h 


这 些 .c 文件 包含 了 由 该 软件 包 提供 的 两 个 C 程序 (style 和 diction) ， 被 分 割 成 模块 。 这 是 一 种 常见 做 法 ， 把 大 型 程序 分 解 
成 更 小 ， 更 容易 管理 的 代码 块 。 源 码 文件 都 是 普通 文本 ， 可 以 用 less 命令 查 看 : 


[me@linuxbox diction-1.11]$ less diction.c 


这 些 .h 文件 以 头 文件 而 著称 。 它 们 也 是 普通 文件 。 头 文件 包含 了 程序 的 描述 ， 这 些 程序 被 包括 在 源码 文件 或 库 中 。 为 了 让 编 
译 器 链接 到 模块 ， 编 译 器 必须 接受 所 需 的 所 有 模块 的 描述 ， 来 完成 整个 程序 。 在 diction.c 文件 的 开头 附近 ， 我 们 看 到 这 行 代 
码 : 


#include "getopt.h" 


这 行 代码 指示 编译 器 去 读 取 文 件 getopth， 因 为 它 会 读 取 diction.c 中 的 源码 ， 为 的 是 “知道 " getopt.c 中 的 内 容 。 getopt'c 文 
件 提供 由 style 和 diction 两 个 程序 共享 的 代码 。 


在 getopt.h 的 include 语句 上 面 ， 我 们 看 到 一 些 其 它 的 include 语句 ， 比 如 这 些 : 


#include <regex.h> 
#include <stdio.h> 

#include <stdlib.h> 
#include <string.h> 
#include <unistd.h> 


这 些 也 涉及 到 头 文件 ， 但 是 这 些 头 文件 居住 在 当前 源码 树 的 外 面 。 它 们 由 操作 系统 供给 ， 来 支持 每 个 程序 的 编译 。 如 果 我 们 
看 一 下 /usr/include 目录 ， 能 看 到 它们 : 


[me@linuxbox diction-1.11]$ ls /usr/include 





当 我 们 安装 编译 器 的 时 候 ， 这 个 目录 中 的 头 文件 会 被 安装 。 
构建 程序 


大 多 数 程序 通过 一 个 简单 的 ， 两 个 命令 的 序列 建立 : 


./configure 
make 


这 个 configure 程序 是 一 个 shell 脚本 ， 由 源码 树 提供 。 它 的 工作 是 分 析 程 序 建立 环境 。 大 多 数 源码 会 设计 为 可 移植 的 。 也 
就 是 说 ， 它 被 设计 成 ， 能 建立 在 多 于 一 个 的 类 Unix 系统 中 。 但 是 为 了 做 到 这 一 点 ， 在 建立 程序 期 间 ， 为 了 适应 系统 之 间 的 差 
异 ， 源码 可 能 需要 经 过 轻微 的 调整 。configure 也 会 检查 是 否 安装 了 必要 的 外 部 工具 和 组 件 。 让 我 们 运行 configure 命令。 
因为 configure 命令 所 在 的 位 置 不 是 位 于 shell 通常 期 望 程序 所 呆 的 地 方 ， 我 们 必须 明确 地 告诉 shell 它 的 位 置 ， 通 过 在 命令 
之 前 加 上 ./ 字符， 来 表明 程序 位 于 当前 工作 目录 : 





[me@linuxbox diction-1.11]$ ./configure 


configure 将 会 输出 许多 信息 ， 随 着 它 测试 和 配置 整个 构建 过 程 。 当 结束 后 ， 输 出 结果 看 起 来 像 这 样 : 


checking libintl.h presence... yes 
checking for libintl.h... yes 

checking for library containing gettext... none required 
configure: creating ./config.status 
config.status: creating Makefile 
config.status: creating diction.1 
config.status: creating diction.texi 
config.status: creating diction.spec 
config.status: creating style.1 
config.status: creating test/rundiction 
config.status: creating config.h 
[me@linuxbox diction-1.11]$ 


这 里 最 重要 的 事情 是 没有 错误 信息 。 如 果 有 错误 信息 ， 整 个 配置 过 程 失败 ， 然 后 程序 不 能 构建 直到 修正 了 错误 。 


我 们 看 到 在 我 们 的 源码 目录 中 configure 命令 创建 了 几 个 新 文件 。 最 重要 一 个 是 Makefile。Makefile 是 一 个 配置 文件 ， 指示 
make 程序 究竟 如 何 构建 程序 。 没 有 它 ，make 程序 就 不 能 运行 。Makefile 是 一 个 普通 文本 文件 ， 所 以 我 们 能 查看 它 : 


[me@linuxbox diction-1.11]$ less Makefile 


这 个 make 程序 把 一 个 makefile 文件 作为 输入 (通常 命名 为 Makefile) ，makefile 文件 描述 了 包括 最 终 完成 的 程序 的 各 组 
件 之 间 的 关系 和 依赖 性 。 


makefile 文件 的 第 一 部 分 定义 了 变量 ， 这 些 变量 在 该 makefile 后 续 章 节 中 会 被 替换 掉 。 例 如 我 们 看 看 这 一 行 代码 : 


其 定义 了 所 用 的 C 编译 器 是 gcc。 文 件 后 面部 分 ， 我 们 看 到 一 个 使 用 该 变量 的 实例 : 


diction: diction.o sentence.o misc.o getopt.o getopt1.0 
$(CC) -0 $@ $(LDFLAGS) diction.o sentence.o misc.o\ 
getopt.o getopt1.o $(LIBS) 


这 里 完成 了 一 个 蔡 换 操作 ， 在 程序 运行 时 ，$(CC) 的 值 会 被 替换 成 gcc。 大 多 数 makefile 文件 由 行 组 成 ， 每 行 定义 一 个 目标 
文件 ， 在 这 种 情况 下 ， 目 标 文件 是 指 可 执行 文件 diction， 还 有 目标 文件 所 依赖 的 文件 。 剩 下 的 行 描述 了 从 目标 文件 的 依赖 组 
件 中 创建 目标 文件 所 需 的 命令 。 在 这 个 例子 中 ， 我 们 看 到 可 执行 文件 diction (最 终 的 成 品 之 一 ) 依赖 于 文件 
diction.0，sentence.0，misc.0，getopto， 和 getopt1.0 都 存在 。 在 makefile 文件 后 面部 分 ， 我 们 看 到 diction 文件 所 依赖 
的 每 一 个 文件 做 为 目标 文件 的 定义 : 


diction.o: diction.c config.h getopt.h misc.h sentence.h 
getopt.o: getopt.c getopt.h getopt_int.h 

getopt1.0: getopt1.c getopt.h getopt_int.h 

misc.o: misc.c config.h misc.h 

sentence.o: sentence.c config.h misc.h sentence.h 
style.o: style.c config.h getopt.h misc.h sentence.h 


然而 ， 我 们 不 会 看 到 针对 它们 的 任何 命令 。 这 个 由 一 个 通用 目标 解决 ， 在 文件 的 前 面 ， 描 述 了 这 个 命令 ， 用 来 把 任意 的 .c 文 
件 编译 成 .0 文件 : 


$(CC) -c $(CPPFLAGS) $(CFLAGS) $< 


这 些 看 起 来 非常 复杂 。 为 什么 不 简单 地 列 出 所 有 的 步骤 ， 编 译 完成 每 一 部 分 ? 一 会 儿 就 知道 答案 了 。 同 时 ， 让 我 们 运行 
make 命 合并 构建 我 们 的 程序 : 


[me@linuxbox diction-1.11]$ make 


这 个 make 程序 将 会 运行 ， 使 用 Makefile 文件 的 内 容 来 指导 它 的 行为 。 它 会 产生 很 多 信息 。 





当 make 程序 运行 结束 后 ， 现 在 我 们 将 看 到 所 有 的 目标 文件 出 现在 我 们 的 目录 中 。 


[me@linuxbox diction-1.11]$ ls 


config.guess de.po en en_GB sentence.c 
config.h diction en_GB.mo en_GB.po sentence.h 
config.h.in diction.1 getopt1.c getopt1.0 sentence.o 
config.log diction.1.in getopt.c getopt.h style 
config.status diction.c getopt int.h getopt.o style.1 
config.sub diction.o INSTALL install-sh style.1.in 
configure diction.pot Makefile Makefile.in style.c 
configure.in diction.spec misc.c misc.h style.o 
COPYING diction.spec.in misc.o NEWS test 

de diction.texi nl nl.mo 

de.mo diction.texi.i nl.po README 


在 这 些 文件 之 中 ， 我 们 看 到 diction 和 style， 我 们 开始 要 构建 的 程序 。 恭 喜 一 切 正 常 ! 我 们 刚才 源码 编译 了 我 们 的 第 一 个 程 
序 。 但 是 出 于 好 奇 ， 让 我 们 再 运行 一 次 make 程序 : 


[me@linuxbox diction-1.11]$ make 
make: Nothing to be done for “all'. 


它 只 是 产生 这 样 一 条 奇怪 的 信息 。 怎 么 了 ?为 什么 它 没有 重新 构建 程序 呢 ? 啊 ， 这 就 是 make 奇妙 之 多 了 。make 只 是 构建 
需要 构建 的 部 分 ， 而 不 是 简单 地 重新 构建 所 有 的 内 容 。 由 于 所 有 的 目标 文件 都 存在 ，make 确定 没有 任何 事情 需要 做 。 我 们 
可 以 证 明 这 一 点 ， 通 过 删除 一 个 目标 文件 ， 然 后 再 次 运行 make 程序 ， 看 看 它 做 些 什 么 。 让 我 们 去 掉 一 个 中 间 目 标 文件 : 





[me@linuxbox diction-1.11]$ rm getopt.o 
[me@linuxbox diction-1.11]$ make 


我 们 看 到 make 重新 构建 了 getopt.o 文件 ， 并 重新 链接 了 diction 和 style 程序 ， 因 为 它们 依赖 于 丢失 的 模块 。 这 种 行为 也 指 
出 了 make 程序 的 另 一 个 重要 特征 : 它 保持 目标 文件 是 最 新 的 。make 坚持 目标 文件 要 新 于 它们 的 依赖 文件 。 这 个 非常 有 意 
义 ， 做 为 一 名 程序 员 ， 经 常会 更 新 一 点 儿 源 码 ， 然 后 使 用 make 来 构建 一 个 新 版 本 的 成 品 。make 确保 基于 更 新 的 代码 构建 
了 需要 构建 的 内 容 。 如 果 我 们 使 用 touch 程序 ， 来 "更 新 "其 中 一 个 源码 文件 ， 我 们 看 到 发 生 了 这 样 的 事情 : 





[me@linuxboxdiction-1.11]$ ls -| diction getopt.c 
-rWxr-xr-Xx 1 me me 37164 2009-03-05 06:14 diction 
-rw-r--r-- 1] Mme me 33125 2007-03-30 17:45 getopt.c 
[me@linuxboxdiction-1.11]$ touch getopt.c 
[me@linuxboxdiction-1.11]$ ls -| diction getopt.c 
-rWxr-xr-Xx 1 me me 37164 2009-03-05 06:14 diction 
-rw-r--r-- 1] Mme me 33125 2009-03-05 06:23 getopt.c 
[me@linuxbox diction-1.11]$ make 


运行 make 之 后 ， 我 们 看 到 目标 文件 已 经 更 新 于 它 的 依赖 文件 : 


[me@linuxbox diction-1.11]$ Is -| diction getopt.c 
-rWxr-xr-x 1 me me 37164 2009-03-05 06:24 diction 
-rw-r--r-- 1 me me 33125 2009-03-05 06:23 getopt.c 


make 程序 这 种 智能 地 只 构建 所 需要 构建 的 内 容 的 特性 ， 对 程序 来 说 ， 是 巨大 的 福利 。 虽 然 在 我 们 的 小 项 目 中 ， 节 省 的 时 间 
可 能 不 是 非常 明显 ， 在 庞大 的 工程 中 ， 它 具有 非常 重大 的 意义 。 记 住 ，Linux 内 核 (一 个 经 历 着 不 断 修改 和 改进 的 程序 ) 包 
含 了 几 百 万 行 代码 。 


安装 程序 


打包 良好 的 源码 经 常 包 括 一 个 特别 的 make 目标 文件 ， 叫 做 install。 这 个 目标 文件 将 在 系统 目录 中 安装 最 终 的 产品 ， 以 供 使 
用 。 通常 ， 这 个 目录 是 /usr/local/bin， 为 在 本 地 所 构建 软件 的 传统 安装 位 置 。 然 而 ， 通 常 普通 用 户 不 能 写 入 该 目录 ， 所 以 我 
们 必须 变 成 超级 用 户 ， 来 执行 安装 操作 : 


[me@linuxbox diction-1.11]$ sudo make install 

After we perform the installation, we can check that the program is ready to go: 
[me@linuxbox diction-1.11]$ which diction 

/usr/local/bin/diction 

[me@linuxbox diction-1.11]$ man diction 

And there we have it! 


总 结 


心口 


在 这 一 章 中 ， 我 们 已 经 知道 了 三 个 简单 命令 : 


./configure 
make 
make install 


可 以 用 来 构建 许多 源码 包 。 我 们 也 知道 了 在 程序 维护 过 程 中 ，make 程序 起 到 了 举足轻重 的 作用 。make 程序 可 以 用 到 任何 
需要 维护 一 个 目标 /依赖 关系 的 任务 中 ， 不 仅仅 为 了 编译 源 代 码 。 


拓展 阅读 

e Wikipedia 上 面 有 关于 编译 器 和 make 程序 的 好 文章 : 
http://en.wikipedia.org/Wwiki/Compiler 
http://en.wikipedia.org/wiki/Make_(software) 

。 GNU Make 手册 


http:/www.gnu.org/software/make/manual/html_node/index.html 


编写 第 一 个 Shell 脚本 


在 前 面 的 章节 中 ， 我 们 已 经 装备 了 一 个 命令 行 工 具 的 武器 库 。 虽 然 这 些 工 具 能 够 解决 许多 种 计算 问题 ， 但 是 我 们 仍然 局 限于 
在 命令 行 中 手动 地 一 个 一 个 使 用 它们 。 难 道 不 是 很 棒 ， 如 果 我 们 能 够 让 shell 来 完成 更 多 的 工作 ? 我 们 可 以 的 。 通 过 把 我 们 
的 工具 一 起 放置 到 我 们 自己 设计 的 程序 中 ， 然 后 shell 就 会 自己 来 执行 这 些 复杂 的 任务 序列 。 通过 编写 shell 脚本 ， 我 们 让 
shell 来 做 这 些 事情 。 


什么 是 Shell 脚本 ? 


最 简单 的 解释 ， 一 个 shell 脚本 就 是 一 个 包含 一 系列 命令 的 文件 。shell 读 取 这 个 文件 ， 然 后 执行 文件 中 的 所 有 命令 ， 就 好 像 
命令 已 经 直接 被 输入 到 了 命令 行 中 一 样 。 


Shell 有 些 独特 ， 因 为 它 不 仅 是 一 个 功能 强大 的 命令 行 接口 ,也 是 一 个 脚本 语言 解释 器 。 我 们 将 会 看 到 ， 大 多 数 能 够 在 命令 行 
中 完成 的 任务 也 能 够 用 脚本 来 实现 ， 同 样 地 ， 大 多 数 能 用 脚本 实现 的 操作 也 能 够 在 命令 行 中 完成 。 


虽然 我 们 已 经 介绍 了 许多 shell 功能 ， 但 只 是 集中 于 那些 经 常 直 接 在 命令 行 中 使 用 的 功能 。 Shell 也 提供 了 一 些 通常 (但 不 总 
是 ) 在 编写 程序 时 才 使 用 的 功能 。 


怎样 编写 一 个 Shell 脚本 

为 了 成 功 地 创建 和 运行 一 个 shell 脚本 ， 我 们 需要 做 三 件 事 情 : 

1. 编写 一 个 脚本 。 Shell 脚本 就 是 普通 的 文本 文件 。 所 以 我 们 需要 一 个 文本 编辑 器 来 书写 它们 。 最 好 的 文本 编辑 器 都 会 支 
持 语法 高 亮 ， 这 样 我 们 就 能 够 看 到 一 个 脚本 关键 字 的 彩色 编码 视图 。 语 法 高 亮 会 帮助 我 们 查看 某 种 常见 错误 。 为 了 编写 
脚本 文件 ，vim，gedit，kate， 和 许多 其 它 编辑 器 都 是 不 错 的 候选 者 。 


2. 使 脚本 文件 可 执行 。 系统 会 相当 挑剔 不 允许 任何 旧 的 文本 文件 被 看 作 是 一 个 程序 ， 并 且 有 充分 的 理由 ! 所 以 我 们 需要 设 
证 脚本 文件 的 权限 来 允许 其 可 执行 。 


3. 把 脚本 放置 到 she// 能 够 找到 的 地 方 。 当 没有 指定 可 执行 文件 明确 的 路 径 名 时 ，shell 会 自动 地 搜索 某 些 目录 ， 来 查找 此 
可 执行 文件 。 为 了 最 大 程度 的 方便 ， 我 们 会 把 脚本 放 到 这 些 目录 当中 。 


脚本 文件 格式 


为 了 保持 编程 传统 ， 我 们 将 创建 一 个 “hello world" 程序 来 说 明 一 个 极端 简单 的 脚本 。 所 以 让 我 们 启动 我 们 的 文本 编辑 器 ， 然 
后 输入 以 下 脚本 : 


#!/bin/bash 
# This is our first script. 
echo 'Hello World!' 


对 于 脚本 中 的 最 后 一 行 ， 我 们 应 该 是 相当 的 熟悉 ， 仅 仅 是 一 个 带 有 一 个 字符 串 参 数 的 echo 命令 。 对 于 第 二 行 也 很 熟悉 。 它 
看 起 来 像 一 个 注释 ， 我 们 已 经 在 许多 我 们 检查 和 编辑 过 的 配置 文件 中 看 到 过 。 关 于 shell 脚本 中 的 注释 ， 它 们 也 可 以 出 现在 
文本 行 的 末尾 ， 像 这 样 : 


echo 'Hello World!'# This is a comment too 


文本 行 中 ，# 符号 之 后 的 所 有 字符 都 会 被 忽略 。 


类 似 于 许多 命令 ， 这 也 在 命令 行 中 起 作用 : 


[me@linuxbox ~]$ echo 'Hello World!'# This is a comment too 
Hello World! 


虽然 很 少 在 命令 行 中 使 用 注释 ， 但 它们 也 能 起 作用 。 


我 们 脚本 中 的 第 一 行文 本 有 点 儿 神 秘 。 它 看 起 来 它 应 该 是 一 条 注释 ， 因 为 它 起 始 于 一 个 # 符 号 ， 但 是 它 看 起 来 太 有 意义 ， 以 
至 于 不 仅仅 是 注释 。 事 实 上 ， 这 个 #! 字 符 序列 是 一 种 特殊 的 结构 叫做 shebang。 这 个 shebang 被 用 来 告诉 操作 系统 将 执行 
此 脚本 所 用 的 解释 器 的 名 字 。 每 个 shell 脚本 都 应 该 把 这 一 文本 行 作为 它 的 第 一 行 。 


让 我 们 把 此 脚本 文件 保存 为 hello_world。 


下 一 步 我 们 要 做 的 事情 是 让 我 们 的 脚本 可 执行 。 使 用 chmod 命令 ， 这 很 容易 做 到 : 


[me@linuxbox ~]$ ls -| hello_world 

-rw-r--r--1 me me 63 2009-03-07 10:10 hello_world 
[me@linuxbox ~]$ chmod 755 hello_world 

[me@linuxbox ~]$ ls -| hello_world 

-rwxr-xr-Xx1 me me 63 2009-03-07 10:10 hello_world 


对 于 脚本 文件 ， 有 两 个 常见 的 权限 设置 ; 权限 为 755 的 脚本 ， 则 每 个 人 都 能 执行 ， 和 权限 为 700 的 脚本 ， 只 有 文件 所 有 者 能 
够 执行 。 注 意 为 了 能 够 执行 脚本 ， 脚 本 必须 是 可 读 的 。 


脚本 文件 位 置 


当 设 置 了 脚本 权限 之 后 ， 我 们 就 能 执行 我 们 的 脚本 了 : 


[me@linuxbox ~]$ ./hello_world 
Hello World! 


为 了 能 够 运行 此 脚本 ， 我 们 必须 指定 脚本 文件 明确 的 路 径 。 如 果 我 们 没有 那样 做 ， 我 们 会 得 到 这 样 的 提示 : 


[me@linuxbox ~]$ hello_world 
bash: hello_world: command not found 


为 什么 会 这 样 呢 ?什么 使 我 们 的 脚本 不 同 于 其 它 的 程序 3 结果 证 明 ， 什 么 也 没有 。 我 们 的 脚本 没有 问题 。 是 脚本 存储 位 置 的 
问题 。 回 到 第 12 章 ， 我 们 讨论 了 PATH 环境 变量 及 其 它 在 系统 查找 可 执行 程序 方面 的 作用 。 回 顾 一 下 ， 如 果 没 有 给 出 可 执行 
程序 的 明确 路 径 名 ， 那 么 系统 每 次 都 会 搜索 一 系列 的 目录 ， 来 查找 此 可 执行 程序 。 这 个 /bin 目录 就 是 其 中 一 个 系统 会 自动 搜 
索 的 目录 。 这 个 目录 列表 被 存储 在 一 个 名 为 PATH 的 环境 变量 中 。 这 个 PATH 变量 包含 一 个 由 冒号 分 隔 开 的 目录 列表 。 我 
们 可 以 查看 PATH 的 内 容 : 








[me@linuxbox ~]$ echo $PATH 
/home/me/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin: 
/bin:/usr/games 


这 里 我 们 看 到 了 我 们 的 目录 列表 。 如 果 我 们 的 脚本 驻扎 在 此 列表 中 任意 目录 下 ， 那 么 我 们 的 问题 将 会 被 解决 。 注 意 列 表 中 的 
第 一 个 目录 ，/home/me/bin。 大 多 数 的 Linux 发 行 版 会 配置 PATH 变量 ， 让 其 包含 一 个 位 于 用 户主 目录 下 的 bin 目录 ， 从 而 
允许 用 户 能 够 执行 他 们 自己 的 程序 。 所 以 如 果 我 们 创建 了 一 个 bin 目录 ， 并 把 我 们 的 脚本 放 在 这 个 目录 下 ， 那 么 这 个 脚本 就 
应 该 像 其 它 程 序 一 样 开始 工作 了 : 











[me@linuxbox ~]$ mkdir bin 
[me@linuxbox ~]$ mv hello_world bin 
[me@linuxbox ~]$ hello_world 

Hello World! 


它 的 确 工作 了 。 


如 果 这 个 PATH 变量 不 包含 这 个 目录 ， 我 们 能 够 轻松 地 添加 它 ， 通 过 在 我 们 的 .bashrc 文件 中 包含 下 面 这 一 行文 本 : 


export PATH= ~/bin:"$PATH" 


当做 了 这 个 修改 之 后 ， 它 会 在 每 个 新 的 终端 会 话 中 生效 。 为 了 把 这 个 修改 应 用 到 当前 的 终端 会 话 中 ， 我 们 必须 让 shell 重新 
读 取 这 个 .bashrc 文件 。 这 可 以 通过 “sourcing".bashrc 文件 来 完成 : 


[me@linuxbox ~]$ . .bashrc 


这 个 点 (.) 命令 是 source 命令 的 同义词 ， 一 个 shell 内 部 命 伟 ， 用 来 读 取 一 个 指定 的 shell 命令 文件 ， 并 把 它 看 作 是 从 键盘 
中 输入 的 一 样 。 


注意 : 在 Ubuntu 系统 中 ， 如 果 存 在 ~/bin 目录 ， 当 执行 用 户 的 .bashrc 文件 时 ， Ubuntu 会 自动 地 添加 这 个 ~/bin 目录 到 
PATH 变量 中 。 所 以 在 Ubuntu 系统 中 ， 如 果 我 们 创建 了 这 个 ~/bin 目录 ， 随 后 退出 ， 然 后 再 登录 ， 一 切 会 正常 运行 。 





脚本 文件 的 好 去 你 


这 个 ~/bin 目录 是 存放 为 个 人 所 用 脚本 的 好 地 方 。 如 果 我 们 编写 了 一 个 脚本 ， 系 统 中 的 每 个 用 户 都 可 以 使 用 它 ， 那么 这 个 肢 
本 的 传统 位 置 是 /ustr/local/bin。 系 统管 理 员 使 用 的 脚本 经 常 放 到 /usrlocal/sbin 目录 下 。 大 多 数 情况 下 ， 本 地 支持 的 软件 ， 
不 管 是 脚本 还 是 编译 过 的 程序 ， 都 应 该 放 到 /usr/local 目录 下 ， 而 不 是 在 /bin 或 /usrbin 目录 下 。 这 些 目录 都 是 由 Linux 文 
件 系统 层次 结构 标准 指定 ， 只 包含 由 Linux 发 行商 所 提供 和 维护 的 文件 。 








更 多 的 格式 技巧 


严肃 认真 的 脚本 书写 ， 一 个 关键 目标 是 为 了 维护 方便 ; 也 就 是 说 ， 一 个 脚本 可 以 轻松 地 被 作者 或 其 它 用 户 修改 ， 使 它 适应 变 
化 的 需求 。 使 脚本 容易 阅读 和 理解 是 一 种 方便 维护 的 方法 。 








长 选项 名 称 


我 们 学 过 的 许多 命令 都 以 长 短 两 种 选项 名 称 为 特征 。 例 如 ， 这 个 ls 命 合 有 许多 选项 既 可 以 用 短 形式 也 可 以 用 长 形式 来 表示 。 
例如 : 


[me@linuxbox ~]$ Is -ad 
和 : 
[me@linuxbox ~]$ ls --all --directory 


是 等 价 的 命令 。 为 了 减少 输入 ， 当 在 命令 行 中 输入 选项 的 时 候 ， 短 选项 更 受 欢迎 ， 但 是 当 书写 脚本 的 时 候 ， 长 选项 能 提供 可 


缩 进 和 行 继续 符 


当 履 佣 长 命令 的 时 候 ， 通 过 把 命令 在 几 个 文本 行 中 展开 ， 可 以 提高 命令 的 可 读 性 。 在 第 十 八 章 中 ， 我 们 看 到 了 一 个 特别 长 的 
find 命令 实例 : 


[me@linuxbox ~]$ find playground \( -type f -not -perm 0600 -exec 
chmod 0600 ‘{}’ ';’\) -or \( -type d -not -perm 0711 -exec chmod 
(A PY) 


显然 ， 这 个 命令 有 点 儿 难 理解 ， 当 第 一 眼看 到 它 的 时 候 。 在 脚本 中 ， 这 个 命令 可 能 会 比较 容易 理解 ， 如 果 这 样 书写 它 : 


find playground \ 
NO 
-type f\ 
-not -perm 0600\ 
-exec chmod 0600 ‘{}’ 人 
NA 
-or\ 
NN 
-type d \ 
-not -perm 0711\ 
-exec chmod 0711 ‘{}’';'\ 
V 


通过 使 用 行 继续 符 ( 反 斜 杠 - 回 车 符 序列 ) 和 缩 进 ， 这 个 复杂 命 合 的 逻辑 性 更 清楚 地 描述 给 读者 。 这 个 技巧 在 命令 行 中 同样 生 
效 ， 虽 然 很 少 使 用 它 ， 因 为 输入 和 编辑 这 个 命令 非常 麻烦 。 脚 本 和 命令 行 的 一 个 区 别 是， 脚本 可 能 履 佣 tab 字符 拉 实 现 缩 
进 ， 然 而 命令 行 却 不 能 ， 因 为 tab 字符 被 用 来 激活 自动 补 全 功能 。 


为 书写 脚本 配置 vim 
这 个 vim 文本 编辑 器 有 许多 许多 的 配置 设置 。 有 几 个 常见 的 选项 能 够 有 助 于 脚本 书写 : 
:syntax on 


打开 语法 高 之 。 通 过 这 个 设置 ， 当 查看 脚本 的 时 候 ， 不 同 的 shell a li on 显示 。 这 对 于 识别 某 些 编 
程 错 误 很 有 帮助 。 并 且 它 看 起 来 也 很 酷 。 注 意 为 了 这 个 功能 起 作用 ， 你 必须 安装 了 一 个 完整 的 vim 版本， 并且 你 编辑 
的 文件 必须 有 一 个 shebang， 来 说 明 这 个 文件 是 一 个 shell 脚本 。 pe ph 你 遇 到 了 困难 ， 试 试 :set 
syntax=sh。 





:set hlsearch 


打开 这 个 选项 是 为 了 高 亮 查找 结果 。 比 如 说 我 们 查找 单词 “echo"。 通 过 设置 这 个 选项 ， 这 个 单词 的 每 个 实例 会 高 亮 显 
示 。 


:Settabstop=4 


设置 一 个 tab 字符 所 占据 的 列 数 。 上 默认 是 8 列 。 把 这 证 为 4 (一 种 常见 做 法 ) ， 从 而 让 长 文本 行 更 容易 适应 屏 
幕 。 


:set autoindent 


打开 "auto indent' 功能 。 这 导致 vim 能 对 新 的 文本 行 缩 进 与 刚 输入 的 文本 行 相同 的 列 数 。 对 于 许多 编程 结构 来 说 ， 这 
就 加 速 了 输入 。 停 止 缩 进 ， 输 入 Ctrl-d。 


通过 把 这 些 命令 〈 没 有 开头 的 冒号 字符 ) 添加 到 你 的 ~/.vimrc 文件 中 ， 这 些 改动 会 永久 生效 。 





在 这 脚本 编写 的 第 一 章 中 ， 我 们 已 经 看 过 怎样 编写 脚本 ， 怎 样 让 它们 在 我 们 的 系统 中 轻松 地 执行 。 我 们 也 知道 了 怎样 使 用 各 
种 格式 技巧 来 提高 脚本 的 可 读 性 (可 维护 性 ) 。 在 以 后 的 各 章 中 ， 轻 松 维护 会 作为 编写 好 脚本 的 中 心 法 则 一 次 又 一 次 地 出 


现 。 
拓展 阅读 
。 查看 各 种 各 样 编程 语言 的 “Hello World" 程 序 和 实例 : 
http://en.wikipedia.org/wiki/Hello_world 
e。 这 篇 Wikipedia 文章 讨论 了 更 多 关于 shebang 机 制 的 内 容 : 


http://en.wikipedia.org/wiki/Shebang_(Unix) 


启动 一 个 项 目 




















从 这 一 章 开始 ， 我 们 将 建设 一 个 项 目 。 这 个 项 目的 目的 是 为 了 了 解 怎样 使 用 各 种 各 样 的 shell 功能 来 创建 程序 ， 更 重要 的 
是 ， 创 建 好 程序 。 


我 们 将 要 编写 的 程序 是 一 个 报告 生成 器 。 它 会 显示 系统 的 各 种 统计 数据 和 它 的 状态 ， 并 将 产生 HTML 格式 的 报告 ， 所 以 我 们 
能 通过 网 络 浏览 器 ， 比 如 说 Firefox 或 者 Konqueror， 来 查看 这 个 报告 。 


通常 ， 创 建 程序 要 经 过 一 系列 阶段 ， 每 个 阶段 会 添加 新 的 特性 和 功能 。 我 们 程序 的 第 一 个 阶段 将 会 产生 一 个 非常 小 的 HTML 
网 页 ， 其 不 包含 系统 信息 。 随 后 我 们 会 添加 这 些 信息 。 


第 一 阶段 : 最 小 的 文档 


首先 我 们 需要 知道 的 事 是 一 个 规则 的 HTML 文档 的 格式 。 它 看 起 来 像 这 样 : 


<HTML> 
<HEAD> 
<TITLE>Page Title</TITLE> 
</HEAD> 
<BODY> 
Page body. 
</BODY> 
</HTML> 


如 果 我 们 将 这 些 内 容 输入 到 文本 编辑 器 中 ， 并 把 文件 保存 为 foo.html， 然 后 我 们 就 能 在 Firefox 中 使 用 下 面 的 URL 来 查看 文 
件 内 容 : 


file:///home/username/foo.html 


程序 的 第 一 个 阶段 将 这 个 HTML 文件 输出 到 标准 输出 。 我 们 可 以 编写 一 个 程序 ， 相 当 容 易 地 完成 这 个 任务 。 启动 我 们 的 文本 
编辑 器 ， 然 后 创建 一 个 名 为 ~/bin/sys_info_page 的 新 文件 : 


[me@linuxbox ~]$ vim ~/bin/sys_info_page 
随后 输入 下 面 的 程序 : 


#1!/bin/bash 
# Program to output a system information page 
echo "<HTML>" 


echo" <HEAD>" 

echo " <TITLE>Page Title</TITLE>" 
echo" </HEAD>" 

echo™" <BODYS 

echo " Page body." 

echo™" </BODY>" 


echo "</HTML>" 


我 们 第 一 次 尝试 解决 这 个 问题 ， 程 序 包 含 了 一 个 shebang， 一 条 注释 (总 是 一 个 好 主意 ) 和 一 系列 的 echo 命 
负责 输出 一 行文 本 。 保 存 文件 之 后 ， 我 们 将 让 它 成 为 可 执行 文件 ， 再 尝试 运行 它 : 


中 


er 全 全 
， 每 个 命 倒 


[me@linuxbox ~]$ chmod 755 ~/bin/sys_info_page 
[me@linuxbox ~]$ sys_info_page 


当 程 序 运行 的 时 候 ， 我 们 应 该 看 到 HTML 文本 在 屏幕 上 显示 出 来 ， 因 为 脚本 中 的 echo 命令 会 输出 发 送 到 标准 输出 。 我 们 再 
文 


[me@linuxbox ~]$ sys_info_page > sys_info_page.html 
[me@linuxbox ~]$ firefox sys_info_page.html 





到 目前 为 止 ， 一 切 顺 利 。 


在 编写 程序 的 时 候 ， 尽 量 做 到 简单 明了 ， 这 总 是 一 个 好 主意 。 当 一 个 程序 易于 阅读 和 理解 的 时 候 ， 维护 它 也 就 更 容易 ， 更 不 
用 说 ， 通 过 减少 键入 量 ， 可 以 使 程序 更 容易 书写 了 。 我 们 当前 的 程序 版 本 工作 正常 ， 但 是 它 可 以 更 简单 些 。 实 际 上 ， 我 们 可 
以 把 所 有 的 echo 命令 结合 成 一 个 echo 命令 ， 当 然 这 桩 能 更 容易 地 添加 更 多 的 文本 行 到 程序 的 输出 中 。 那 么 ， 把 我 们 的 程 
序 修改 为 : 


#1!/bin/bash 
# Program to output a system information page 
echo "<HTML> 
<HEAD> 
<TITLE>Page Title</TITLE> 
</HEAD> 
<BODY> 
Page body. 
</BODY> 
</HTML>" 


个 带 引 号 的 字符 串 可 能 包含 换行 符 ， 因 此 可 以 包含 多 个 文本 行 。Shell 会 持续 读 取 文 本 直到 它 遇 到 右 引号 。 它 在 命令 行 中 
也 是 这 样 工作 的 : 


[me@linuxbox ~]$ echo "<HTML> 
> <HEAD> 
<TITLE>Page Title</TITLE> 
3 </HEAD> 
<BODY> 
> Page body. 
</BODY> 
></HTML>" 


开头 的 “>" 字符 是 包含 在 PS2shell 变量 中 的 shell 提示 符 。 每 当 我 们 在 shell 中 键入 多 行 语句 的 时 候 ， 这 个 提示 符 就 会 出 
现 。 现 在 这 个 功能 有 点 儿 星 涩 ， 但 随后 ， 当 我 们 介绍 多 行 编程 语句 时 ， 它 会 派 上 大 用 场 。 


第 二 阶段 : 添加 一 点 儿 数 据 


现在 我 们 的 程序 能 生成 一 个 最 小 的 文档 ， 让 我 们 给 报告 添加 些 数 据 吧 。 为 此 ， 我 们 将 做 以 下 修改 : 


#1!/bin/bash 
# Program to output a system information page 
echo "<HTML> 
<HEAD> 
<TITLE>System Information Report</TITLE> 
</HEAD> 
<BODY> 
<H1>System Information Report</H1> 
</BODY> 
</HTML>" 


我 们 增加 了 一 个 网 页 标题 ， 并 且 在 报告 正文 部 分 加 了 一 个 标题 。 
变量 和 常量 


然而 ， 我 们 的 脚本 存在 一 个 问题 。 请 注意 字符 串 “System Information Report" 是 怎样 被 重复 使 用 的 ? 对 于 这 个 微小 的 脚本 而 
言 ， 它 不 是 一 个 问题 ， 但 是 让 我 们 设想 一 下 ， 我 们 的 脚本 非常 元 长 ， 并 且 我 们 有 许多 这 个 字符 串 的 实例 。 如 果 我 们 想 要 更 换 
一 个 标题 ， 我 们 必须 对 脚本 中 的 许多 地 方 做 修改 ， 这 会 是 很 大 的 工作 量 。 如 果 我 们 能 整理 一 下 脚本 ， 让 这 个 字符 串 只 出 现 一 
次 而 不 是 多 次 ， 会 怎样 呢 ? 这 样 会 使 今后 的 脚本 维护 工作 更 加 轻松 。 我 们 可 以 这 样 做 : 


#!/bin/bash 
# Program to output a system information page 
title="System Information Report" 
echo "<HTML> 
<HEAD> 
<TITLE> $title</TITLE> 
</HEAD> 
<BODY> 
<H1l>$s$title</H1> 
</BODY> 
</HTML>" 


通过 创建 一 个 名 为 title 的 变量 ， 并 把 “System Information Report' 字 符 串 赋值 给 它 ， 我 们 就 可 以 利用 参数 展开 功能 ， 把 这 个 
字符 串 放 到 文件 中 的 多 个 位 置 。 


那么 ， 我 们 怎样 来 创建 一 个 变量 呢 ? 很 简单 ， 我 们 只 管 使 用 它 。 当 shell 碰 到 一 个 变量 的 时 候 ， 它 会 自动 地 创建 它 。 这 不 同 
于 许多 编程 语言 ， 它 们 中 的 变量 在 使 用 之 前 ， 必 须 显 式 的 声明 或 是 定义 。 关 于 这 个 问题 ，shell 要 求 非常 宽松 ， 这 可 能 会 导 
致 一 些 问题 。 例 如 ， 考 虑 一 下 在 命令 行 中 发 生 的 这 种 情形 : 





[me@linuxbox ~]$ foo="yes" 
[me@linuxbox ~]$ echo $foo 
yes 

[me@linuxbox ~]$ echo $fool 
[me@linuxbox ~]$ 


首先 我 们 把 "yes" 赋 给 变量 foo， 然 后 用 echo 命令 来 显示 变量 值 。 接 下 来 ， 我 们 显示 拼写 错误 的 变量 名 “fool" 的 变量 值 ， 然 后 
得 到 一 个 空 值 。 这 是 因为 shell 很 高 兴 地 创建 了 变量 fool， 当 shell 遇 到 fool 的 时 候 ， 并 且 赋 给 fool 一 个 空 的 默认 值 。 
此 ， 我 们 必须 小 心 着 慎 地 拼写 ! 同样 理解 实例 中 究竟 发 生 了 什么 事情 也 很 重要 。 从 我 们 以 前 学 习 shell 执行 展开 操作 ， 我 们 


知道 这 个 命令 : 


[me@linuxbox ~]$ echo $foo 


经 历 了 参数 展开 操作 ， 然 后 得 到 : 


me@linuxbox ~]$ echo yes 


然而 这 个 命令 : 





me@linuxbox ~]$ echo $fool 


展开 为 : 


[me@linuxbox ~]$ echo 


这 个 空 变量 展开 值 为 空 ! 对 于 需要 参数 的 命令 来 说 ， 这 会 引起 混乱 。 下 面 是 一 个 例子 : 


[me@linuxbox ~]$ foo=foo.txt 

[me@linuxbox ~]$ foo1=fool.txt 

[me@linuxbox ~]$ cp $foo $fool 

cp: missing destination file operand after ‘foo.txt' 
Try ‘cp --help' for more information. 


我 们 给 两 个 变量 赋值 ，foo 和 foo1。 然 后 我 们 执行 cp 操作 ， 但 是 拼写 错 了 第 二 个 参数 的 名 字 。 参数 展开 之 后 ， 这 个 cp 命 
只 接受 到 一 个 参数 ， 虽 然 它 需要 两 个 。 


中 


有 一 些 关 于 变量 名 的 规则 : 
1. 变量 名 可 由 字母 数字 字符 (字母 和 数字 ) 和 下 划 线 字符 组 成 。 


. 变量 名 的 第 一 个 字符 必须 是 一 个 字母 或 一 个 下 划 线 。 


DL 
[oa 


3. 变量 名 中 不 允许 出 现 空格 和 标点 符号 。 


单词 “variable” 意味 着 可 变 的 值 ， 并 且 在 许多 应 用 程序 当中 ， 都 是 以 这 种 方式 来 使 用 变量 的 。 然 而 ， 我 们 应 用 程序 中 的 变 

量 ，title， 被 用 作 一 个 常量 。 常 量 有 一 个 名 字 且 包含 一 个 值 ， 在 这 方面 就 像 是 变量 。 不 同 之 处 是 常量 的 值 是 不 能 改变 的 。 在 
执行 几何 运算 的 应 用 程序 中 ， 我 们 可 以 把 PI 定义 为 一 个 常量 ， 并 把 3.1415 赋值 给 它 ， 用 它 来 代替 数字 字面 值 。shell 不 能 
辨别 变量 和 常量 ; 它们 大 多 数 情况 下 是 为 了 方便 程序 员 。 一 个 常用 惯例 是 指定 大 写字 母 来 表示 常量 ， 小 写字 母 表示 真正 的 变 
量 。 我 们 将 修改 我 们 的 脚本 来 遵从 这 个 惯例 : 





#1!/bin/bash 
# Program to output a system information page 
TITLE="System Information Report For $HOSTNAME" 
echo "<HTML> 
<HEAD> 
<TITLE> $title</TITLE> 
</HEAD> 
<BODY> 
<H1l>$title</H1> 
</BODY> 
</HTML>" 


我 们 亦 借 此 机 会 ， 通 过 在 标题 中 添加 shell 变量 名 HOSTNAME， 让 标题 变 得 活 浅 有 趣 些 。 这 个 变量 名 是 这 台 机 器 的 网 络 名 
称 。 


注意 : 实际 上 ，shell 确实 提供 了 一 种 方法 ， 通 过 使 用 带 有 -r (只 读 ) 选项 的 内 部 命令 declare， 来 强制 常量 的 不 变性 。 如 果 
我 们 给 TITLE 这 样 赋值 : 


那么 shell 会 阻止 之 后 给 TITLE 的 任意 赋值 。 这 个 功能 极 少 被 使 用 ， 但 为 了 很 早 之 前 的 脚本 ， 它 仍然 存在 。 


给 变量 和 常量 赋值 


这 里 是 我 们 真正 开始 使 用 参数 扩展 知识 的 地 方 。 正 如 我 们 所 知道 的 ， 这 样 给 变量 赋值 : 
variable=value 


这 里 的 variable 是 变量 的 名 字 ，value 是 一 个 字符 串 。 不 同 于 一 些 其 它 的 编程 语言 ，shell 不 会 在 平 变量 值 的 类 型 ; 它 把 它们 
都 看 作 是 字符 串 。 通 过 使 用 带 有 -i 选项 的 declare 命令 ， 你 可 以 强制 shell 把 赋值 限制 为 整 型 ， 但 是 ， 正 如 像 设置 变量 为 只 
读 一 样 ， 极 少 这 样 做 。 


注意 在 赋值 过 程 中 ， 变 量 名 ， 等 号 和 变量 值 之 间 必 须 没有 空格 。 那 么 ， 这 些 值 由 什么 组 成 呢 ? 可 以 展开 成 字符 串 的 任意 值 : 


a= # Assign the string "z" to variable a. 

b="a string" # Embedded spaces must be within quotes. 

c="a string and $b"  # Other expansions such as variables can be 
# expanded into the assignment. 


d=$(ls -| foo.txt) # Results of a command. 
= # Arithmetic expansion. 
f="\t\ta string\n" # Escape sequences such as tabs and newlines. 


可 以 在 同一 行 中 对 多 个 变量 赋值 : 


a=5 b="a string" 


在 参数 展开 过 程 中 ， 变 量 名 可 能 被 花 括号 “{}" 包围 着 。 由 于 变量 名 周围 的 上 下 文 ， 其 变 得 不 明确 的 情况 下 ， 这 会 很 有 帮助 。 
这 里 ， 我 们 试图 把 一 个 文件 名 从 myfile 改 为 myfile1， 使 用 一 个 变量 : 


[me@linuxbox ~]$ filename="myfile" 
[me@linuxbox ~]$ touch $filename 
[me@linuxbox ~]$ mv $filename $filenamel 

mv: missing destination file operand after myfile' 
Try ~ mv --help' for more information. 


种 党 试 失败 了 ， 因 为 shell 把 mv 命令 的 第 二 个 参数 解释 为 一 个 新 的 〈 并 且 空 的 ) 变量 。 通 过 这 种 方法 可 以 解决 这 个 问 


了 保护 


[me@linuxbox ~]$ mv $filename ${filename}1 


通过 添加 花 括号 ，shell 不 再 把 末尾 的 1 解释 为 变量 名 的 一 部 分 。 


我 们 将 利用 这 个 机 会 来 添加 一 些 数据 到 我 们 的 报告 中 ， 即 创建 包括 的 日 期 和 时 间 ， 以 及 创建 者 的 用 户 名 : 


#!/bin/bash 
# Program to output a system information page 
TITLE="System Information Report For $HOSTNAME" 
CURRENT_TIME=$(date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT TIME, by $USER" 
echo "<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
</BODY> 
</HTML>" 


我 们 已 经 知道 了 两 种 不 同 的 文本 输出 方法 ， 两 种 方法 都 使 用 了 echo 命令 。 还 有 第 三 种 方法 ， 叫 做 here document 或 者 here 
script。 一 个 here document 是 另外 一 种 I/O 重 定向 形式 ， 我 们 在 脚本 文件 中 嵌入 正文 文本 ， 然 后 把 它 发 送 给 一 个 命 合 的 标 
准 输入 。 它 这 样 工作 : 


command << token 
text 
token 


这 里 的 command 是 一 个 可 以 接受 标准 输入 的 命令 名 ，token 是 一 个 用 来 指示 赂 入 文本 结束 的 字符 串 。 我 们 将 修改 我 们 的 脚 
本 ， 来 使 用 一 个 here document: 


#!/bin/bash 
# Program to output a system information page 
TITLE="System Information Report For $HOSTNAME" 
CURRENT TIME=$(date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT TIME, by $USER" 
tat << EOF 
<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
< BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
</BODY> 
</HTML> 
EQFS 


取代 echo 命 舍 ， 现 在 我 们 的 脚本 使 用 cat 命令 和 一 个 here document。 这 个 字符 串 _EOF (意思 是 “文件 结尾 ”， 一 个 常见 
用 法 ) 被 选 作为 tpken， 并 标志 着 散人 文本 的 结尾 。 注 意 这 个 token 必须 在 一 行 中 单独 出 现 ， 并 且 文 本 行 中 没有 末尾 的 空 
格 。 


那么 使 用 一 个 here document 的 优点 是 什么 呢 ? 它 很 大 程度 上 和 echo 一 样 ， 除 了 默认 情况 下 ，here documents 中 的 单 引 
号 和 双 引 号 会 失去 它们 在 shell 中 的 特殊 含义 。 这 里 有 一 个 命令 中 的 例子 : 


[me@linuxbox ~]$ foo="some text" 
[me@linuxbox ~]$ cat << _EOF_ 
> $foo 

> "$foo" 

> '$foo' 

> \$foo 

>nEOF 

some text 

"some text" 

'some text' 

$foo 


正如 我 们 所 见 到 的 ，shell 根本 没有 注意 到 引号 。 它 把 它们 看 作 是 普通 的 字符 。 这 就 允许 我 们 在 一 个 here document 中 可 以 
随意 的 嵌入 引号 。 对 于 我 们 的 报告 程序 来 说 ， 这 将 是 非常 方便 的 。 


Here documents 可 以 和 任意 能 接受 标准 输入 的 命令 一 块 使 用 。 在 这 个 例子 中 ， 我 们 使 用 了 一 个 here document 将 一 系列 的 
命令 传递 到 这 个 ftp 程序 中 ， 为 的 是 从 一 个 远 端 FTP 服务 器 中 得 到 一 个 文件 : 


#!/bin/bash 

# Script to retrieve a file via FTP 
FTP_SERVER=ftp.nl.debian.org 
FTP_PATH=/debian/dists/lenny/main/installer-i386/current/images/cdrom 
REMOTE_FILE=debian-cd_info.tar.gz 
fpsne<<EOF 

open $FTP_SERVER 

user anonymous me@linuxbox 

cd $FTP_PATH 

hash 

get $REMOTE_FILE 

bye 

EOF 

ls -| $REMOTE_FILE 


如 果 我 们 把 重 定向 操作 符 从 “<\<” 改 为 “<\<-”，shell 会 忽略 在 此 here document 中 开头 的 tab 字符 。 这 就 能 缩 进 一 个 here 
document， 从 而 提高 脚本 的 可 读 性 : 


#!/bin/bash 
# Script to retrieve a file via FTP 
FTP_SERVER=ftp.nl.debian.org 
FTP_PATH=/debian/dists/lenny/main/installer-i386/current/images/cdrom 
REMOTE_FILE=debian-cd_info.tar.gz 
ftp -n <<-_EOF 

open $FTP_SERVER 

user anonymous me@linuxbox 

cd $FTP_PATH 

hash 

get $REMOTE_FILE 

bye 
EOF 
ls -| $REMOTE_FILE 


在 这 一 章 中 ， 我 们 启动 了 一 个 项 目 ， 其 带领 我 们 领略 了 创建 一 个 成 功 脚本 的 整个 过 程 。 同时 我 们 介绍 了 变量 和 常量 的 概念 ， 
以 及 怎样 使 用 它们 。 它 们 是 我 们 将 找到 的 众多 参数 展开 占用 程序 中 的 第 一 批 实例 。 我 们 也 知道 了 怎样 从 我 们 的 脚本 文件 中 产 
生 输 出 ， 及 其 各 种 各 样 戏 入 文本 块 的 方法 。 


拓展 阅读 

e 关于 HTML 的 更 多 信息 ， 查 看 下 面 的 文章 和 教材 : 
http://en.wikipedia.org/Wwiki/Html 
http://en.wikibooks.org/wiki/HTML_Programming 
http://html.net/tutorials/html/ 


e@ Bash 手册 包括 一 节 “HERE DOCUMENTS" 的 内 容 ， 其 详细 的 讲述 了 这 个 功能 。 


自 顶 向 下 设计 


随 着 程序 变 得 更 加 庞大 和 复杂 ， 设 计 ， 编 码 和 维护 它们 也 变 得 更 加 困难 。 对 于 任意 一 个 大 项 目 而 言 ， 把 繁重 ， 复 杂 的 任务 分 
割 为 细小 且 简 单 的 任务 ， 往 往 是 一 个 好 主意 。 想 象 一 下 ， 我 们 试图 描述 一 个 平凡 无 奇 的 工作 ， 一 位 火星 人 要 去 市 场 买 食物 。 
我 们 可 能 通过 下 面 一 系列 步 又 来 形容 整个 过 程 : 

e 上 车 

e@ 开车 到 市 场 

e 停车 

。 买 食物 

。 回 到 车 中 

。 开车 回 家 

。 回 到 家 中 

然而 ， 火 星人 可 能 需要 更 详细 的 信息 。 我 们 可 以 进一步 细 化 子 任务 “停车 "为 这 些 步骤 : 

。 找到 停车 位 

e 开车 到 停车 位 

。 关闭 引擎 

e 拉 紧 手刹 

e 下 车 

e。 锁 车 


这 个 “关闭 引擎 " 子 任务 可 以 进一步 细 化 为 这 些 步 又， 包括 “关闭 点 火 装置 "“ 移 开 点 火 匙 "等 等 ， 直 到 已 经 完整 定义 了 要 去 市 场 
买 食物 整个 过 程 的 每 一 个 步骤 。 


这 种 先 确定 上 层 步 又 ， 然 后 再 逐步 细 化 这 些 步骤 的 过 程 被 称 为 自 顶 向 下 设计 。 这 种 技巧 允许 我 们 把 庞大 而 复 条 的 任务 分 割 为 
许多 小 而 简单 的 任务 。 自 项 向 下 设计 是 一 种 常见 的 程序 设计 方法 ， 尤其 适合 shell 编程 。 


在 这 一 章 中 ， 我 们 将 使 用 自 顶 向 下 的 设计 方法 来 进一步 开发 我 们 的 报告 产生 器 脚本 。 





目前 我 们 的 脚本 执行 以 下 步骤 来 产生 这 个 HTML 文档 : 
e 打开 网 页 

e 打开 网 页 标 头 

e 设置 网 页 标题 

e 关闭 网 页 标 头 

。 打开 网 页 主体 部 分 

e 输出 网 页 标 头 

。 输出 时 间 截 


e 关闭 网 页 主体 


e 关闭 网 页 
为 了 下 一 阶段 的 开发 ， 我 们 将 在 步骤 7 和 8 之 间 添 加 一 些 额外 的 任务 。 这 些 将 包括 : 


e 系统 正常 运行 时 间 和 负载 。 这 是 自 上 次 关机 或 重启 之 后 系统 的 运行 时 间 ， 以 及 在 几 个 时 间 间 隔 内 当前 运行 在 处 理 中 的 平 
均 任 务 量 。 





e 磁盘 空间 。 系 统 中 存储 设备 的 总 使 用 量 。 





。 主 目录 空间 。 每 个 用 户 所 使 用 的 存储 空间 数量 。 


如 果 对 于 每 一 个 任务 ， 我 们 都 有 相应 的 命 售 ， 那 么 通过 命令 替换 ， 我 们 就 能 很 容易 地 把 它们 添加 到 我 们 的 脚本 中 : 


#!/bin/bash 
# Program to output a system information page 
TITLE="System Information Report For $HOSTNAME" 
CURRENT TIME=$(date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT TIME, by $USER" 
cat mC 
<HTML> 
<HEAD> 
<TILE SME</MEES 
</HEAD> 
<BODY> 
<=HL>$MTNE</HL> 
<P>$TIME_STAMP</P> 
$(report_uptime) 
$(report disk space) 
$(report home space) 
</BODY> 
</HTML> 
是 EOE 


我 们 能 够 用 两 种 方法 来 创建 这 些 额外 的 命令 。 我 们 可 以 分 别 编写 三 个 脚本 ， 并 把 它们 放置 到 环境 变量 PATH 所 列 出 的 目录 
下 ， 或 者 我 们 也 可 以 把 这 些 脚本 作为 shell 画 数 拨 入 到 我 们 的 程序 中 。 我 们 之 前 已 经 提 到 过 ，shell 函数 是 位 于 其 它 脚本 中 
的 “ 微 脚本 "， 作 为 自主 程序 。Shell 画 数 有 两 种 语法 形式 : 


function name { 
commands 
return 

} 

and 

name (){ 
commands 
return 


} 


这 里 的 name 是 函数 名 ，commands 是 一 系列 包含 在 函数 中 的 命令 。 


两 种 形式 是 等 价 的 ， 可 以 交 葵 使用。 下面 我 们 将 查看 一 个 说 明 shell 函数 使 用 方法 的 脚本 : 


#!/bin/bash 
# Shell function demo 


function funct { 
echo "Step 2" 
return 


} 


ovOwm 上 WwWwNP 


10 # Main program starts here 


12 echo "Step 1" 
13 funct 
14 echo "Step 3" 


随 着 shell 读 取 这 个 脚本 ， 它 会 跳 过 第 1 行 到 第 11 行 的 代码 ， 因 为 这 些 文本 行 由 注释 和 画 数 定义 组 成 。 从 第 12 行 代码 开始 执 
行 ， 有 一 个 echo 命令 。 第 13 行 会 调用 shell 函数 funct， 然 后 shell 会 执行 这 个 画 数 ， 就 如 执行 其 它 命令 一 样 。 这 样 程序 控 
制 权 会 转移 到 第 六 行 ， 执 行 第 二 个 echo 命 伟 。 然 后 再 执行 第 7 行 。 这 个 return 命 合 终 止 这 个 画 数 ， 并 把 控制 权 交 给 画 数 调 
用 之 后 的 代码 (第 14 行 ) ， 从 而 执行 最 后 一 个 echo 命 爷 。 注 意 为 了 使 男 数 调用 被 识别 出 是 shell 函数 ， 而 不 是 被 解释 为 外 部 
程序 的 名 字 ， 所 以 在 脚本 中 shell 函数 定义 必须 出 现在 图 数 调用 之 前 。 


我 们 将 给 脚本 添加 最 小 的 shell 函数 定义 : 


#!/bin/bash 
# Program to output a system information page 
TITLE="System Information Report For $HOSTNAME" 
CURRENT TIME=$(date +"%x %r %Z") 
TIME_STAMP="Generated $CURRENT TIME, by $USER" 
report_uptime () { 
return 
} 
report disk space (){ 
return 
} 
report_ home space (){ 
return 
cot EOFS 
<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIME_STAMP</P> 
$(report_uptime) 
$(report disk space) 
$(report_ home _space) 
</BODY> 
</HTML> 
四 EGR 


Shell 函数 的 命名 规则 和 变量 一 样 。 一 个 函数 必须 至 少 包含 一 条 命令 。 这 条 return 命令 〈 是 可 选 的) 满足 要 求 。 


局 部 变量 





目前 我 们 所 写 的 脚本 中 ， 所 有 的 变量 (包括 常量 ) 都 是 全 局 变量 。 全 局 变量 在 整个 程序 中 保持 存在 。 对 于 许多 事情 来 说 ， 这 
很 好 ， 但 是 有 时 候 它 会 使 shell 本 数 的 使 用 变 得 复杂 。 在 shell 画 数 中 ， 经 常 期 望 会 有 局 部 变量 。 局 部 变量 只 能 在 定义 它们 的 
shell 函数 中 使 用 ， 并 且 一 旦 shell 函数 执行 完毕 ， 它 们 就 不 存在 了 。 

















拥有 局 部 变量 允许 程序 员 使 用 的 局 部 变量 名 ， 可 以 与 已 存在 的 变量 名 相同 ， 这 些 变量 可 以 是 全 局 变量 ， 或 者 是 其 它 shell 函 
数 中 的 局 部 变量 ， 却 不 必 担 心 潜在 的 名 字 冲 突 。 


这 里 有 一 个 实例 脚本 ， 其 说 明了 怎样 来 定义 和 使 用 局 部 变量 : 
#!/bin/bash 


# local-vars: script to demonstrate local variables 
foo=0 # global variable foo 


TUmGEE et 
local foo # variable foo local to funct 1 
foo=1 
echo "funct_1: foo = $foo" 

} 

Fumete2a et 
local foo # variable foo local to funct 2 
foo=2 
echo "funct 2: foo = $foo" 

echo "global: foo = $foo" 

Fume 

echo "global: foo = $foo" 

funct 2 


echo "global: foo = $foo" 


正如 我 们 所 看 到 的 ， en 个 只 对 其 所 在 的 shell 函数 起 作用 的 
变量 。 在 这 个 shell 画 数 之 外 ， 这 个 变量 不 再 存在 。 当 我 们 运行 这 个 脚本 的 时 候 ， 我 们 会 看 到 这 样 的 结果 : 


[me@linuxbox ~]$ local-vars 
global: foo = 0 
funct 1:foo = 1 
global: foo = 0 
funct 2:foo = 2 
global: foo = 0 


我 们 看 到 对 两 个 shell 函数 中 的 局 部 变量 foo 赋值 ， 不 会 影响 到 在 范 数 之 外 定义 的 变量 foo 的 值 。 


个 功能 就 允许 shell 函数 能 保持 各 自 以 及 与 它们 所 在 脚本 之 间 的 独立 性 。 这 个 非常 有 价值 ， 因 为 它 帮 忙 阻止 了 程序 各 部 分 
es 这 样 shell 函数 也 可 以 移植 。 也 就 是 说 ， 按 照 需求 ， shell 函数 可 以 在 脚本 之 间 进 行 剪 切 和 粘贴 。 


保持 脚本 运行 


当 开 发 程序 的 时 候 ， 保 持 程 序 的 可 执行 状态 非常 有 用 。 这 样 做 ， 并 且 经 常 测试 ， 我 们 就 可 以 在 程序 开发 过 程 的 早期 检测 到 错 
误 。 这 将 使 调试 问题 容易 多 了 。 例 如 ， 如 果 我 们 运行 这 个 程序 ， 做 一 个 小 的 修改 ， 然后 再 次 执行 这 个 程序 ， 最 后 发 现 一 个 问 
题 ， 非 常 有 可 能 这 个 最 新 的 修改 就 是 问题 的 来 源 。 通 过 添加 空 画 数 ， 程序 员 称 之 为 占 位 符 ， 人 
逻辑 流程 。 当 构建 一 个 占 位 符 的 时 候 ， 能 够 包含 一 些 为 程序 员 提 供 反 馈 信息 的 代码 是 一 个 不 错 的 主意 ， 这 些 信息 展示 了 正在 
执行 的 逻辑 流程 。 现在 看 一 下 我 们 脚本 的 输出 结果 : 





[me@linuxbox ~]$ sys_info_page 

<HTML> 

<HEAD> 

<TITLE>System Information Report For twin2</TITLE> 
</HEAD> 

<BODY> 

<H1>System Information Report For linuxbox</H1> 
<P>Generated 03/19/2009 04:02:10 PM EDT, by me</P> 


</BODY> 
</HTML> 


我 们 看 到 时 间 惟 之 后 的 输出 结果 中 有 一 些 空 行 ， 但 是 我 们 不 能 确定 这 些 空 行 产 生 的 原因 。 如 果 我 们 修改 这 些 函 数 ， 让 它们 包 
含 一 些 反 馈 信 息 /也 ， 


report_uptime () { 
echo "Function report_uptime executed." 
return 
} 
report disk space (){ 
echo "Function report disk space executed." 
return 
} 
report home space (){ 
echo "Function report_ home space executed." 





[me@linuxbox ~]$ sys_info_page 
<HTML> 
<HEAD> 


<TITLE>System Information Report For linuxbox</TITLE> 


</HEAD> 
<BODY> 


<H1>System Information Report For linuxbox</H1> 
<P>Generated 03/20/2009 05:17:26 AM EDT, by me</P> 


Function report_uptime executed. 
Function report_disk_space executed. 
Function report_home_space executed. 
</BODY> 

</HTML> 


现在 我 们 看 到 ， 事 实 上 ， 执 行 了 三 个 加 数 。 


我 们 的 函数 框架 已 经 各 就 各 位 并 且 能 工作 ， 是 时 候 更 新 一 些 函 数 代 码 了 。 首 先 ， 是 report_uptime 辑 数 : 


report_uptime () { 

Cat EOFS 
<H2>System Uptime</H2> 
<PRE>$(uptime)</PRE> 

加 EGR 

return 


这 些 代 码 相 当 直 截 了 当 。 我 们 使 用 一 个 here 文档 来 输出 标题 和 uptime 命 兮 
的 是 保持 命令 的 输出 格式 。 这 个 report_disk_space 辑 数 类 似 : 


report_disk_ space (){ 
cca“SEQOR 
<H2>Disk Space Utilization</H2> 
<PRE>$(df -h)</PRE> 
WEQRE 
return 


这 个 函数 使 用 df -h 命令 来 确定 磁盘 空间 的 数量 。 


report_home space () 
coat EQRFR 
<H2>Home Space Utilization</H2> 
<PRE>$(du -sh /home/*)</PRE> 
EQFES 
return 


} 


我 们 使 用 带 有 -sh 选项 的 du 命令 来 完成 这 个 任务 。 然 而 ， 这 并 不 是 此 问题 的 完整 解决 方案 。 虽 然 它 会 在 一 些 系统 (例如 
Ubuntu) 中 起 作用 ， 但 是 在 其 它 系 统 中 它 不 工作 。 这 是 因为 许多 系统 会 设置 主 目录 的 权限 ， 以 此 阻止 其 它 用 户 读 取 它 们 ， 
是 一 个 合理 的 安全 措施 。 在 这 些 系统 中 ， 这 个 report_home_space 辑 数 ， 


最 后 ， 我 们 将 建造 report_home_space 辑 数 : 


作 。 一 个 更 好 的 解决 方案 是 让 脚本 能 根据 用 户 的 使 用 权限 来 调整 自己 的 行为 。 我 们 将 在 下 一 章 中 讨论 这 个 问题 。 


你 的 .bashrc 文件 中 的 shell 函数 


Shell 沙 数 是 更 为 完美 的 别名 替代 物 ， 实 际 上 是 创建 较 小 的 个 人 所 用 命 合 的 首选 方法 。 别 名 非常 








局 限于 命令 的 种 类 和 





它们 支持 的 shell 功能 ， 然 而 shell 函数 允许 任何 可 以 编写 脚本 的 东西 。 例如 ， 如 果 我 们 喜欢 为 我 们 的 脚本 开发 的 这 
个 report_disk_space shell 函数 ， 我 们 可 以 为 我 们 的 .bashrc 文件 创建 一 个 相似 的 名 为 ds 的 函数 : 


输出 结果 ， 命 全 结果 被 <PRE> 标签 包围 ， 为 


这 


只 有 用 超级 用 户 权 限 执 行 我 们 的 脚本 时 ， 才 会 工 


ds () { 
echo “Disk Space Utilization For $ HOSTNAME” 


df -h 


一 章 中 ， 我 们 介绍 了 一 种 常见 的 程序 设计 方法 ， 叫 做 自 顶 向 下 设计 ， 并 且 我 们 知道 了 怎样 使 用 shell 函数 按照 要 求 来 完成 
步 细 化 的 任务 。 我 们 也 知道 了 怎样 使 用 局 部 变量 使 shell 函数 独立 于 其 它 函 数 ， 以 及 其 所 在 程序 的 其 它 部 分 。 这 就 有 可 能 


这 
逐 ; 
使 shell 函 数 以 可 移植 的 方式 编写 ， 并 且 能 够 重复 使 用 ， 通 过 把 它们 放置 到 多 个 程序 中 ; 节省 了 大 量 的 时 间 。 
拓展 阅读 

e Wikipedia 上 面 有 许多 关于 软件 设计 原理 的 文章 。 这 里 是 一 些 好 文章 : 


http://en.wikipedia.org/Wwiki/Top-down_design 


http://en.wikipedia.org/Wwiki/Subroutines 


流程 控制 : if 分 支 结构 


在 上 一 章 中 ， 我 们 遇 到 一 个 问题 。 怎 样 使 我 们 的 报告 生成 器 脚本 能 适应 运行 此 脚本 的 用 户 的 权限 ? 这 个 问题 的 解决 方案 要 求 
我 们 能 找到 一 种 方法 ， 在 脚本 中 基于 测试 条 件 结果 ， 来 "改变 方向 "。 用 编程 术语 表达 ， 就 是 我 们 需要 程序 可 以 分 支 。 让 我 们 
考虑 一 个 简单 的 用 伪 码 表示 的 逻辑 实例 ， 伪 码 是 一 种 模拟 的 计算 机 语言 ， 为 的 是 便于 人 们 理解 : 


X=5 

IfX = 5, then: 

Say “X equals 5.” 
Otherwise: 

Say “Xis not equal to 5.” 


这 就 是 一 个 分 支 的 例子 。 根 据 条 件 ，“Does X = 5?” 做 一 件 事 情 , “Say X equals 5,” 否则 ， 做 另 一 件 事情 , “Say X is not 
equal to 5.” 


使 用 shell， 我 们 可 以 编码 上 面 的 逻辑 ， 如 下 所 示 : 


x=5 
1 tien 
echo "x equals 5." 
else 
echo "x does not equal 5." 
fi 


或 者 我 们 可 以 直接 在 命令 行 中 输入 以 上 代码 〈 略 有 缩短 ) 


[me@linuxbox ~]$ x=5 

[me@linuxbox ~]$ if [ $x = 5 ]; then echo "equals 5"; else echo "does 
not equal 5"; fi 

equals 5 

[me@linuxbox ~]$ x=0 

[me@linuxbox ~]$ if [ $x = 5 ]; then echo "equals 5"; else echo "does 
not equal 5"; fi 

does not equal 5 


在 这 个 例子 中 ， 我 们 执行 了 两 次 这 个 命令 。 第 一 次 是 ， 把 x 的 值 设置 为 5， 从 而 导致 输出 字符 串 "equals 5”, 第 二 次 是 ， 把 x 
的 值 设置 为 0， 从 而 导致 输出 字符 串 "does not equal 5”。 


这 个 放 语 名 语法 如 下 : 


if commands; then 
commands 

[elif commands; then 
commands...] 

[else 
commands] 

fi 


这 里 的 commands 是 指 一 系列 命 全 。 第 一 眼看 到 会 有 点 儿 困惑 。 但 是 在 我 们 弄 清楚 这 些 语句 之 前 ， 我 们 必须 看 一 下 shell 是 
如 何 评判 一 个 命令 的 成 功 与 失败 的 。 


退出 状态 
当 命 全 执行 完 半 后 ， 命 合 包 括 我 们 编写 的 脚本 和 shell 画 数 ) 会 给 系统 发 送 一 个 值 ， 叫 做 退出 状态 。 这 个 值 是 一 个 0 到 


255 之 间 的 整数 ， 说 明 命 令 执 行 成 功 或 是 失败 。 按 照 惯 例 ， 一 个 雾 值 说 明成 功 ， 其 它 所 有 值 说 明 失 败 。 Shell 提供 了 一 个 参 
数 ， 我 们 可 以 用 它 检 查 退 出 状态 。 用 具体 实例 看 一 下 : 


[me@linuxbox ~]$ ls -d /usrbin 

/usr/bin 

[me@linuxbox ~]$ echo $? 

0 

[me@linuxbox ~]$ ls -d /bin/usr 

ls: cannot access /bin/usr: No such file or directory 
[me@linuxbox ~]$ echo $? 

2 


在 这 个 例子 中 ， 我 们 执行 了 两 次 Is 命令 。 第 一 次 ， 命 令 执 行 成 功 。 如 果 我 们 显示 参数 $? 的 值 ， 我 们 看 到 它 是 需 。 我 们 第 二 
次 执行 |s 命令 的 时 候 ， 产 生 了 一 个 错误 ， 并 再 次 查看 参数 $? 。 这 次 它 包 含 一 个 数字 2， 表 明 这 个 命令 遇 到 了 一 个 错误 。 有 
些 命令 使 用 不 同 的 退出 值 ， 来 诊断 错误 ， 而 许多 命令 当 它们 执行 失败 的 时 候 ， 会 简单 地 退出 并 发 送 一 个 数字 1。 手 册页 中 经 
常会 包含 一 章 标题 为 “退出 状态 "的 内 容 ， 描述 了 使 用 的 代码 。 然 而 ， 一 个 老总 是 表明 成 功 。 


这 个 shell 提供 了 两 个 极其 简单 的 内 部 命 舍 ， 它 们 不 做 任何 事情 ， 除 了 以 一 个 老 或 1 退出 状态 来 终止 执行 。 True 命令 总 是 执 
行 成 功 ， 而 false 命令 总 是 执行 失败 : 


[me@linuxbox~]$ true 
[me@linuxbox~]$ echo $7? 
0 

[me@linuxbox~]$ false 
[me@linuxbox~]$ echo $? 
外 


我 们 能 够 使 用 这 些 命 舍 ， 来 看 一 下 计 语 名 是 怎样 工作 的 。f 语句 真正 做 的 事情 是 计算 命令 执行 成 功 或 失败 : 


[me@linuxbox ~]$ if true; then echo "It's true."; fi 
lbsitrue: 

[me@linuxbox ~]$ if false; then echo "It's true."; fi 
[me@linuxbox ~]$ 


当 半 之 后 的 命令 执行 成 功 的 时 候 ， 命 令 echo "ts true." 将 会 执行 ， 否 则 此 命令 不 执行 。 如 果 if 之 后 跟随 一 系列 命 印 ， 则 将 计 
算 列 表 中 的 最 后 一 个 命令 : 


[me@linuxbox ~]$ if false; true; then echo "It's true."; fi 
ls trues 

[me@linuxbox ~]$ if true; false; then echo "It's true."; fi 
[me@linuxbox ~]$ 





3 
测试 
到 目前 为 止 ， 经常 与 if 一块 使 用 的 命 倒是 test。 这 个 test 命令 执行 各 种 各 样 的 检查 与 比较 。 它 有 两 种 等 价 模式 : 


test expression 
比较 流行 的 格式 是 : 
[ expression ] 


这 里 的 expression 是 一 个 表达 式 ， 其 执行 结果 是 true 或 者 是 false。 当 表达 式 为 真 时 ， 这 个 test 命 人 返回 一 个 需 退出 状态 ， 
当 表 达 式 为 假 时 ，test 命令 退出 状态 为 1。 


文件 表达 式 


以 下 表达 式 被 用 来 计算 文件 状态 : 


表达 式 
fle1 -ef file2 
file1 -ntfile2 
file1 -ot file2 
-b file 
-Cfile 
-d file 
-e file 
-ffile 
-g file 
-G file 
-kfile 
-L file 
-Ofile 
-p file 
-r file 
-S file 


-Sfile 
-tfd 


-u file 
-WwW file 


-x file 


表 28-1: 测试 文件 表达 式 
如 果 为 真 


fle1 和 人 file2 拥有 相同 的 索引 号 (通过 硬 链 接 两 个 文件 名 指向 相同 的 文件 ) 。 


file1 新 于 file2。 

fle1 早 于 file2。 

file 存在 并 且 是 一 个 块 〈 设 备 ) 文件 。 
file 存在 并 且 是 一 个 字符 (设备 ) 文件 。 
file 存在 并 且 是 一 个 目录 。 

file 存在 。 

file 存在 并 且 是 一 个 普通 文件 。 

file 存在 并 且 设 置 了 组 
file 存在 并 且 由 有 效 组 ID 拥有 。 

file 存在 并 且 设 置 了 它 的 "sticky bit 。 

file 存在 并 且 是 一 个 符号 链接 。 

file 存在 并 且 由 有 效用 户 ID 拥有 。 

file 存在 并 且 是 一 个 命名 管道 。 

file 存在 并 且 可 读 〈《 有 效用 户 有 可 读 权 限 ) 。 
file 存在 且 其 长 度 大 于 需 。 

file 存在 且 是 一 个 网 络 socket。 


fd 是 一 个 定向 到 终端 了 从 终端 定向 的 文件 描述 符 。 


错误 。 





D。 














file 存在 并 且 设 置 了 setuid 位 。 
file 存在 并 且 可 写 (有 效用 户 拥 有 可 写 权 限 ) 。 
file 存在 并 且 可 执行 (有 效用 户 有 执行 一 搜索 权限 ) 


这 里 我 们 有 一 个 脚本 说 明了 一 些 文件 表达 式 : 


#!/bin/bash 


# test-file: Evaluate the status of a file 
FILE=~/.bashrc 


if [ -e "$FILE" 
if [ -f "$FILE 
echo "$F 


if [ -d "$F 
echo "$F 


if [ -r "$FI 
echo "$F 


if [ -w "$F 
echo "$F 





LE 


;then 
"];then 
LE is a regular file." 


LE" ]; then 


LE is a directory." 


"];then 
LE is readable." 


LE" ]; then 


LE is writable." 


if[ -x "$FILE" ]; then 


echo "$F 
fi 
else 











LE is executable/searchable." 


echo "$FILE does not exist" 


exit 1 
fi 
exit 


这 个 脚本 会 计算 赋值 给 常量 FILE 的 文件 ， 并 显示 计算 结果 。 





对 于 此 脚本 有 两 点 需要 注意 。 第 一 个 ， 


这 可 以 被 用 来 决定 是 否 重 定向 了 标准 输入 二 输出 


o 


在 表达 式 中 参数 $FILE 


是 怎样 被 引用 的 。 引 号 并 不 是 必需 的 ， 但 这 是 为 了 防范 空 参数 。 如 果 $FILE 的 参数 展开 是 一 个 空 值 ， 就 会 导致 一 个 错误 ( 操 
作 符 将 会 被 解释 为 非 空 的 字符 串 而 不 是 操作 符 ) 。 用 引号 把 参数 引起 来 就 确保 了 操作 符 之 后 总 是 跟随 着 一 个 字符 串 ， 即 使 字 
符 串 为 空 。 第 二 个 ， 注 意 脚本 末尾 的 exit 命令 。 这 个 exit 命令 接受 一 个 单独 的 ， 可 选 的 参数 ， 其 成 为 脚本 的 退出 状态 。 当 不 
传递 参数 时 ， 退 出 状态 默认 为 堆 。 以 这 种 方式 使 用 exit 命 舍 ， 则 罗 许 此 脚本 提示 失败 如 果 $FILE 展开 成 一 个 不 存在 的 文件 
名 。 这 个 exit 命令 出 现在 脚本 中 的 最 后 一 行 ， 是 一 个 当 一 个 脚本 “运行 到 最 后 ”( 到 达 文 件 末尾 ) ， 不 管 怎样 ， 默认 情况 下 它 
以 退出 状态 需 终 止 。 





类 似 地 ， 通 过 带 有 一 个 整数 参数 的 return 命令 ，shell 函数 可 以 返回 一 个 退出 状态 。 如 果 我 们 打算 把 上 面 的 脚本 转变 为 一 个 
shell 函数 ， 为 了 在 更 大 的 程序 中 包含 此 责 数 ， 我 们 用 return 语句 来 代替 exit 命令 ， 则 得 到 期 望 的 行为 : 


test file () { 
# test-file: Evaluate the status of a file 
FILE=~/.bashrc 
if [ -e "$FILE" ]; then 
if [ -f "$FILE" ]; then 
echo "$FILE is a regular file." 


if [ -d "$FILE" ]; then 
echo "$FILE is a directory." 


Wr EE then 
echo "$FILE is readable." 


if [ -w "$FILE" ]; then 
echo "$FILE is writable." 


if [ -x "$FILE" ]; then 
echo "$FILE is executable/searchable." 











else 
echo "$FILE does not exist" 
return 1 

fi 


字符 串 表 达 式 


以 下 表达 式 用 来 计算 字符 串 : 
表 28-2: 测试 字符 串 表 达 式 
表达 式 如 果 为 真 .… 
string string 不 为 null。 
-n string 字符 串 string 的 长 度 大 于 需 。 
-z string 字符 串 string 的 长 度 为 需 。 


string1 = string2 


string1 == string2 string1 和 string2 相同 . 单 或 双 等 号 都 可 以 ， 不 过 双 等 号 更 受 欢迎 。 


string1 != string2 string1 和 string2 不 相同 。 
string1 > string2 sting1 排列 在 string2 之 后 。 
string1 < string2 string1 排列 在 string2 之 前 。 


哗 


告 : 这 个 < 和 > 表达 式 操作 符 必 须 用 引号 引起 来 (或 者 是 用 反 斜 杠 转 义 ) ， 当 和 与 test 一 块 使 用 的 时 候 。 如 果 不 这 样 ， 它 们 
会 被 shell 解释 为 重 定向 操作 符 ， 造 成 潜在 地 破坏 结果 。 同时 也 要 注意 虽然 bash 文档 声明 排序 遵从 当前 语系 的 排列 规则 ， 
但 并 不 这 样 。 将 来 的 bash 版 本 ， 包 含 4.0， 使 用 ASCII (POSIX) 排序 规则 。 


#!/bin/bash 

# test-string: evaluate the value of a string 

ANSWER= maybe 

if [ -z "$ANSWER" ]; then 
echo "There is no answer." >&2 
exit 1 

fi 

if [ "$ANSWER" = "yes" ]; then 
echo "The answer is YES." 

elif [ "$ANSWER" = "no" ]; then 
echo "The answer is NO." 

elif [ "$sANSWER" = "maybe" ]; then 
echo "The answer is MAYBE." 

else 
echo "The answer is UNKNOWN." 

fi 


在 这 个 脚本 中 ， 我 们 计算 常量 ANSWER。 我 们 首先 确定 是 否 此 字符 串 为 空 。 如 果 为 空 ， 我 们 就 终止 脚本 ， 并 把 退出 状态 设 
为 震 。 注 意 这 个 应 用 于 echo 命 命 的 重 定 向 操作 。 其 把 错误 信息 “There is no answer.” 重 定向 到 标准 错误 ， 这 是 处 理 错 误 信 
息 的 “合理 "方法 。 如 果 字 符 串 不 为 空 ， 我 们 就 计算 字符 串 的 值 ， 看 看 它 是 否 等 于 “yes,”“no,” 或 者 “maybe”。 为 此 使 用 了 


elif， 它 是 “else if 的 简写 。 
整 型 表达 式 


下 面 的 表达 式 用 于 整数 : 


表达 式 
integer1 -eq integer2 
integer1 -ne integer2 
integer1 -le integer2 
integer1 -ltinteger2 
integer1 -ge integer2 


integer1 -gt integer2 


这 里 是 一 个 演示 以 上 表达 式 用 法 的 脚本 : 


#!/bin/bash 


通过 使 用 elif， 我 们 能 够 构建 更 复 厅 的 逻辑 测试 。 


表 28-3: 测试 整数 表达 式 
如 果 为 真 .… 


integer1 等 于 integer2. 
integer1 不 等 于 integer2. 
integer1 小 于 或 等 于 integer2. 
integer1 小 于 integer2. 
integer1 大 于 或 等 于 integer2. 


integer1 大 于 integer2. 


# test-integer: evaluate the value of an integer. 


INT=-5 
if[ -z "$INT" ]; then 
echo "INTis empty." >&2 
exit 1 
fi 
if [ $INT -eq 0 ]; then 
echo "INTis zero." 
else 
if [ $INT -It 0 ]; then 
echo "INT is negative." 
else 
echo "INTis positive." 
fi 
if[ $((INT % 2)) -eq 0 ]; then 
echo "INT is even." 
else 
echo "INTis odd." 
fi 
fi 


这 个 脚本 中 有 趣 的 地 方 是 怎样 来 确定 一 个 整数 


返回 余数 ， 从 而 知道 数字 是 偶数 还 是 奇数 。 


是 偶数 还 是 奇数 。 通 过 用 模 数 2 对 数字 执行 求 模 操作 ， 


就 是 用 数字 来 除 以 2， 并 


更 现代 的 测试 版 本 


目前 的 bash 版 本 包括 一 个 复合 命 舍 ， 作 为 加 强 的 test 命令 替代 物 。 它 使 用 以 下 语法 : 





[[ expression ]] 


这 里 ， 类 似 于 test，expression 是 一 个 表达 式 ， 其 计算 结果 为 真 或 假 。 这 个 [[ ]] 命令 非常 相似 于 test 命令 〈 它 支持 所 有 的 
表达 式 ) ， 但 是 增加 了 一 个 重要 的 新 的 字符 串 表 达 式 : 


string1l =~ regex 


其 返回 值 为 真 ， 如 果 string1 匹配 扩展 的 正则 表达 式 regex。 这 就 为 执行 比如 数据 验证 等 任务 提供 了 许多 可 能 性 。 在 我 们 前 
面 的 整数 表达 式 示例 中 ， 如 果 常 量 INT 包含 除了 整数 之 外 的 任何 数据 ， 脚 本 就 会 运行 失败 。 这 个 脚本 需要 一 种 方法 来 证 明 此 
常量 包含 一 个 整数 。 使 用 [1 1 和 =~ 字符 串 表达 式 操作 符 ， 我 们 能 够 这 样 来 改进 脚本 : 


#!/bin/bash 
# test-integer2: evaluate the value of an integer. 
INT=-5 
if [[ "$INT" =~ 人 -?[0-9]+$ ]]; then 
if [ $INT -eq 0 ]; then 
echo "INT is zero." 
else 
if [ $INT -lt 0 ]; then 
echo "INTis negative." 
else 
echo "INTis positive." 
fi 
if[ $((INT % 2)) -eq 0 ]; then 
echo "INT is even." 
else 
echo "INTis odd." 
fi 
fi 
else 
echo "INTis not an integer." >&2 
exit 1 
fi 


通过 应 用 正则 表达 式 ， 我 们 能 够 限制 INT 的 值 只 是 字符 串 ， 其 开始 于 一 个 可 选 的 减 号 ， 随 后 是 一 个 或 多 个 数字 。 这 个 表达 式 
也 消除 了 空 值 的 可 能 性 。 


[[]] 添加 的 另 一 个 功能 是 == 操作 符 支 持 类 型 匹配 ， 正 如 路 径 名 展开 所 做 的 那样 。 例 如 : 


[me@linuxbox ~]$ FILE=foo.bar 
[me@linuxbox ~]$ if [[ $FILE == foo.* ]]; then 
> echo "$FILE matches pattern 'foo.*"™ 

光 有 有 

foo.bar matches pattern 'foo.*' 


这 就 使 [[ ]] 有 助 于 计算 文件 和 路 径 名 。 


(()) - 为 整数 设计 


除了 [[]] 复合 命令 之 外 ，bash 也 提供 了 (( )) 复合 命名 ， 其 有 利于 操作 整数 。 它 支持 一 套 完整 的 算术 计算 ， 我 们 将 在 第 35 
章 中 讨论 这 个 主题 。 


(( )) 被 用 来 执行 算术 真 测试 。 如 果 算 术 计 算 的 结果 是 非 需 值 ， 则 一 个 算术 真 测试 值 为 真 。 


[me@linuxbox ~]$ if ((1)); then echo "It is true."; fi 
lt is true. 

[me@linuxbox ~]$ if ((0)); then echo "It is true."; fi 
[me@linuxbox ~]$ 


使 用 (( )) ， 我 们 能 够 略微 简化 test-integer2 脚 本 ， 像 这 样 : 


#1!/bin/bash 
# test-integer2a: evaluate the value of an integer. 
INT=-5 
if [[ "$INT" =~ 人 -?[0-9]+$ ]]; then 
if ((INT == 0)); then 
echo "INT is zero." 
else 


if ((INT < 0)); then 
echo "INTis negative." 
else 
echo "INTis positive." 
fi 
if (( ((INT% 2)) == 0)); then 
echo "INTis even." 
else 
echo "INTis odd." 
fi 
fi 
else 
echo "INTis not an integer." >&2 
exit 1 
fi 


注意 我 们 使 用 小 于 和 大 于 符号 ， 以 及 == 用 来 测试 是 否 相 等 。 这 是 使 用 整数 较为 自然 的 语法 了 。 也 要 注意 ， 因 为 复合 命 
只 义理 整数 ， 
) 命令 和 相关 的 算术 展开 操作 。 


es 
开 操 作 。 我 们 将 在 第 35 中 进 


一 步 讨 论 (( 


结合 表达 式 


也 有 可 能 把 表达 式 结合 起 来 创建 更 复杂 的 计算 。 通 过 使 用 逻辑 操作 符 来 结合 


们 学 习 find 命令 的 时 候 。 它 们 是 用 于 test 和 [[]] 三 个 逻辑 操作 。 
符 来 表示 这 些 操作 : 


命令 (( 


所 以 它 能 够 通过 名 字 识 别 出 变 量 ， 而 不 需要 执行 展 


达 式 。 我 们 在 第 18 章 中 已 经 知道 了 这 些 ， 当 我 


它们 是 AND，OR， 和 NOT。test 和 [[ ]] 使 用 不 同 的 操作 


表 28-4: 逻辑 操作 符 


操作 符 测试 
AND -a 
OR -0 
NOT ! 


这 里 有 一 个 AND 操作 的 示例 。 下 面 的 脚本 决定 了 一 个 整数 是 


#!/bin/bash 
# test-integer3: determine if an integer is within a 
# specified range of values. 
MIN_VAL=1 
MAX_VAL=100 
INT=50 
if [[ "$INT" =~ 人 -?[0-9]+$ ]]; then 
if [[ INT -ge MIN_VAL && INT -le MAX_VAL ]]; then 
echo "$INT is within $MIN_VAL to $MAX_VAL." 
else 
echo "$INT is out of range." 
fi 
else 
echo "INTis not an integer." >&2 
exit 1 
fi 


[[ land (()) 
CR& 


否 属于 某 个 范围 内 的 值 : 


我 们 也 可 以 对 表达 式 使 用 圆 括号 ， 为 的 是 分 组 。 如 果 不 使 用 括号 ， 那 么 否定 只 应 用 于 第 一 个 表达 式 ， 而 不 是 两 个 组 合 的 表达 
式 。 用 test 可 以 这 样 来 编码 : 


if[ !\( $INT -ge $MIN_VAL -a $INT -le $MAX_VAL \) ]; then 
echo "$INT is outside $MIN_VAL to $MAX_VAL." 

else 
echo "$INT is in range." 

fi 


因为 test 使 用 的 所 有 的 表达 式 和 操作 符 都 被 shell 看 作 是 命令 参数 (不 像 [[ ]] 和 (()) ) ， 对 于 bash 有 特殊 含义 的 字符 ， 比 
如 说 <，>，(， 和 )， 必 须 引 起 来 或 者 是 转 义 。 


知道 了 test 和 上 [[ ]] 基本 上 完成 相同 的 事情 ， 哪 一 个 更 好 呢 ?test 更 传统 (是 POSIX 的 一 部 分 ) ， 然而 [[ ]] 特定 于 bash。 知 
道 怎样 使 用 test 很 重要 ， 因 为 它 被 非常 广泛 地 应 用 ， 但 是 显然 ![ ]] 更 有 助 于 ， 并 更 易于 编码 。 


可 移植 性 是 头脑 狭 险 人 士 的 心 魔 

如 果 你 和 “真正 的 " Unix 用 户 交谈 ， 你 很 快 就 会 发 现 他 们 大 多 数 人 不 是 非常 喜欢 Linux。 他 们 认为 Linux 脏 脏 且 不 干 
净 。Unix 追随 者 的 一 个 宗旨 是 ， 一 切 都 点 “可 移植 的 "。 这 意味 着 你 编写 的 任意 一 个 脚本 都 应 当 无 需 修 改 ， 就 能 运行 在 
任何 一 个 类 似 于 Unix 的 系统 中 。 


Unix 用 户 有 充分 的 理由 相信 这 一 点 。 在 POSIX 之 前 ，Unix 用 户 已 经 看 到 了 命令 的 专 有 扩展 以 及 shell 对 Unix 世界 的 
所 做 所 为 ， 他 们 自然 会 警惕 Linux 对 他 们 心爱 系统 的 影响 。 














但 是 可 移植 性 有 一 个 严重 的 缺点 。 它 防 碍 了 进步 。 它 要 求 做 事情 要 遵循 "最低 常见 标准 "。 在 shell 编程 这 种 情况 下 ， 它 
意味 着 一 切 要 与 sh 兼容 ， 最 初 的 Bourne shell。 





这 个 缺点 是 一 个 借口 ， 专 有 软件 供应 商用 它 来 证 明 他 们 的 专利 扩展 ， 只 有 他 们 称 他 们 为 “创新 "。 但 是 他 们 只 是 为 他 们 
的 客户 锁定 设备 。 











GNU 工具 ， 比 如 说 bash， 就 没有 这 些 限制 。 他 们 通过 支持 标准 和 普通 地 可 用 性 来 鼓励 可 移植 性 。 你 几乎 可 以 在 所 有 
类 型 的 系统 中 安装 bash 和 其 它 的 GNU 工具 ， 甚 至 是 Windows， 而 没有 损失 。 所 以 就 感觉 可 以 自由 的 使 用 bash 的 
所 有 功能 。 它 是 真正 的 可 移植 。 














控制 操作 符 : 分 支 的 另 一 种 方法 


bash 支持 两 种 可 以 执行 分 支 任务 的 控制 操作 符 。 这 个 && (AND) 和 || (OR) 操作 符 作 用 如 同 复合 命令 [[ ]] 中 的 逻辑 操作 
符 。 这 是 语法 : 


command1l && command2 
和 


commandl || command2 


理解 这 些 操 作 很 重要 。 对 于 && 操作 符 ， 先 执行 command1， 如 果 并 且 只 有 如 果 command1 执行 成 功 后 ， 才 会 执行 
command2。 对 于 || 操作 符 ， 先 执行 command1， 如 果 并 且 只 有 如 果 command1 执行 失败 后 ， 才 会 执行 command2。 


在 实际 中 ， 它 意味 着 我 们 可 以 做 这 样 的 事情 : 
[me@linuxbox ~]$ mkdirtemp &é& cd temp 


这 会 创建 一 个 名 为 temp 的 目录 ， 并 且 若 它 执 行 成 功 后 ， 当 前 目录 会 更 改 为 temp。 第 二 个 命令 会 党 试 执行 只 有 当 mkdir 命令 
执行 成 功 之 后 。 同 样 地 ， 一 个 像 这 样 的 命令 : 


[me@linuxbox ~]$ [ -dtemp ] || mkdir temp 


会 测试 目录 temp 是 否 存在 ， 并 且 只 有 测试 失败 之 后 ， 才 会 创建 这 个 目录 。 这 种 构造 类 型 非常 有 助 于 在 脚本 中 处 理 错 误 ， 这 
个 主题 我 们 将 会 在 随后 的 章节 中 讨论 更 多 。 例 如 ， 我 们 在 脚本 中 可 以 这 样 做 : 


[ -dtemp ] || exit 1 


如 果 这 个 脚本 要 求 目录 temp， 且 目录 不 存在 ， 然 后 脚本 会 终止 ， 并 返回 退出 状态 1。 


总 结 


SNE 


这 一 章 开始 于 一 个 问题 。 我 们 怎样 使 sys_info_page 脚本 来 检测 是 否 用 户 拥有 权限 来 读 取 所 有 的 主 目录 ? 根据 我 们 的 if 知 
识 ， 我 们 可 以 解决 这 个 问题 ， 通 过 把 这 些 代 码 添加 到 report_home_space 画 数 中 : 


report_home_space () 

if [[ $(id -u) -eq 0 ]]; 
Cat SEOPF 
<H2>Home Space Utilization (All Users)</H2> 
<PRE>$(du -sh /home/*)</PRE> 
EOF 

else 
cat <<-_EOF_ 
<H2>Home Space Utilization ($USER)</H2> 
<PRE>$(du -sh $HOME)</PRE> 
EOF 

fi 

return 


J 


{ 
t 


hen 


我 们 计算 id 命令 的 输出 结果 。 通 过 带 有 -U 选项 的 id 命令 ， 输 出 有 效用 户 的 数字 用 户 ID 号 。 超级 用 户 总 是 需 ， 其 它 每 个 用 户 
是 一 个 大 于 雪 的 数字 。 知 道 了 这 点 ， 我 们 能 够 构建 两 种 不 同 的 here 文档 ， 一 个 利用 超级 用 户 权限 ， 另 一 个 限制 于 用 户 拥有 
的 主 目录 。 


我 们 将 暂 别 sys_info_page 程序 ， 但 不 要 着 急 。 它 还 会 回来 。 同 时 ， 当 我 们 继续 工作 的 时 候 ， 将 会 讨论 一 些 我 们 需要 的 话 


题 。 

拓展 阅读 

bash 手册 页 中 有 几 部 分 对 本 章 中 酒 盖 的 主题 提供 了 更 详细 的 内 容 : 
e。 Lists ( 讨论 控制 操作 符 || 和 && ) 
e Compound Commands (讨论 [[]], (()) 和 if) 
e SHELL BUILTIN COMMANDS ( 讨论 test) 

进一步 ，Wikipedia 中 有 一 篇 关于 伪 代 码 概念 的 好 文章 : 


http://en.wikipedia.org/Wwiki/Pseudocode 


读 取 键盘 输入 


到 目前 为 止 我 们 编写 的 脚本 都 缺乏 一 项 在 大 多 数 计算 机 程序 中 都 很 常见 的 功能 一 交互 性 。 也 就 是 ， 程序 与 用 户 进行 交互 的 能 
力 。 虽 然 许 多 程序 不 必 是 可 交互 的 ， 但 一 些 程序 却 得 到 益处 ， 能 够 直接 接受 用 户 的 输入 。 以 这 个 前 面 章 节 中 的 脚本 为 例 : 


#!/bin/bash 
# test-integer2: evaluate the value of an integer. 
INT=-5 
if [[ "$INT" =~ 人 -?[0-9]+$ ]]; then 
if [ $INT -eq 0 ]; then 
echo "INT is zero." 
else 
if [ $INT -lt 0 ]; then 
echo "INTis negative." 
else 
echo "INTis positive." 
fi 
if[ $((INT % 2)) -eq 0 ]; then 
echo "INT is even." 
else 
echo "INTis odd." 
fi 
fi 
else 
echo "INTis not an integer." >&2 
exit 1 
fi 


每 次 我 们 想 要 改变 INT 数值 的 时 候 ， 我 们 必须 编辑 这 个 脚本 。 如 果 脚 本 能 请 求 用户 输 入 数值 ， 那 么 它 会 更 加 有 用 人 处。 在 这 个 
脚本 中 ， 我 们 将 看 一 下 我 们 怎样 给 程序 增加 交互 性 功能 。 


read - 从 标准 输入 读 取 数值 


这 个 read 内 部 命令 被 用 来 从 标准 输入 读 取 单行 数据 。 这 个 命令 可 以 用 来 读 取 键 盘 输入 ， 当 使 用 重 定 向 的 时 候 ， 读 取 文 件 中 
的 一 行 数 据 。 这 个 命令 有 以 下 语法 形式 : 





read [-options] [variable.…] 
这 里 的 options 是 下 面 列 出 的 可 用 选项 中 的 一 个 或 多 个 ， 且 variable 是 用 来 存储 输入 数值 的 一 个 或 多 个 变量 名 。 如 果 没 有 提 
供 变量 名 ，shell 变量 REPLY 会 包含 数据 行 。 


基本 上 ，read 会 把 来 自 标准 输入 的 字段 赋值 给 具体 的 变量 。 如 果 我 们 修改 我 们 的 整数 求 值 脚本 ， 让 其 使 用 read， 它 可 能 
起 来 像 这 样 : 


#!/bin/bash 
# read-integer: evaluate the value of an integer. 
echo -n "Please enter an integer ->" 
read int 
if [[ "$int" =~ 人 -?[0-9]+$ ]]; then 
if [ $int -eq 0 ]; then 
echo "$int is zero." 
else 
if [ $int -lt 0 ]; then 
echo "$int is negative." 
else 
echo "$int is positive." 
fi 
if[ $((int % 2)) -eq 0 ]; then 
echo "$int is even." 


else 
echo "$int is odd." 
fi 
fi 
else 
echo "Input value is not an integer." >&2 
exit 1 


fi 


我 们 使 用 带 有 -n 选项 〈 其 会 删除 输出 结果 末尾 的 换行 符 ) 的 echo 命 伟 ， 来 显示 提示 信息 ， 然后 使 用 read 来 读 入 变量 int 的 
数值 。 运 行 这 个 脚本 得 到 以 下 输出 : 


[me@linuxbox ~]$ read-integer 
Please enter an integer -> 5 

5 is positive. 

Sais :Odd 


read 可 以 给 多 个 变量 赋值 ， 正 如 下 面 脚本 中 所 示 : 


#!/bin/bash 

# read-multiple: read multiple values from keyboard 
echo -n "Enter one or more values > " 

read varl var2 var3 var4 var5 

echo "varl = '$varl" 

echo "var2 = '$var2" 

echo "var3 = '$var3" 

echo "var4 = '$var4" 

echo "var5 = '$var5" 


不 同 个 数 的 数值 后 ， read 怎样 操作 : 


装 


在 这 个 脚本 中 ， 我 们 给 五 个 变量 赋值 并 显示 其 结果 。 注 意 当 给 


[me@linuxbox ~]$ read-multiple 
Enter one or more values> abcde 


varl = 'a' 
var2='b' 
Var3 = 'C' 
var4 = 'd' 
Var5 = 'e' 


[me@linuxbox ~]$ read-multiple 

Enter one or more values > a 

varl = 'a' 

var2=" 

var3=" 

var4=" 

var5=" 

[me@linuxbox ~]$ read-multiple 

Enter one or more values > abcdefg 


varl = 'a' 
var2='b' 
Var3 = 'C' 
var4 = 'd' 


var5='efg' 





如 果 read 命令 接受 到 变量 值 数目 少 于 期 望 的 数字 ， 那 么 领 外 的 变量 值 为 空 ， 而 多 余 的 输入 数据 则 会 被 包含 到 最 后 一 个 变量 
中 。 如 果 read 命令 之 后 没有 列 出 变量 名 ， 则 一 个 shell 变量 ， REPLY ， 将 会 包含 所 有 的 输入 : 


#!/bin/bash 

# read-single: read multiple values into default variable 
echo -n "Enter one or more values >" 

read 

echo "REPLY = '$REPLY" 


这 个 脚本 的 输出 结果 是 : 


[me@linuxbox ~]$ read-single 
Enter one or more values >abcd 
REPINS=— Sadly 


选项 


read 支持 以 下 选送 : 


表 29-1: read 选项 


选项 说 明 
-aarray 把 输入 赋值 到 数组 array 中 ， 从 索引 号 需 开 始 。 我 们 将 在 第 36 章 中 讨论 数组 问题 。 
-d delimiter 用 字符 串 delimiter 中 的 第 一 个 字符 指示 输入 结束 ， 而 不 是 一 个 换行 符 。 
-e 使 用 Readline 来 义理 输 入 。 这 使 得 与 命令 行 相同 的 方式 编辑 输入 。 
-nnum 读 取 num 个 输入 字符 ， 而 不 是 整 行 。 
-p prompt 为 输入 显示 提示 信息 ， 使 用 字符 串 prompt 
-Tr Raw mode. 不 把 反 斜 杠 字符 解释 为 转 义 字符 。 





Silent mode. 不 会 在 屏幕 上 显示 输入 的 字符 。 当 输入 密码 和 其 它 确认 信息 的 时 候 ， 这 会 
人 很 有 帮助 。 


-tseconds 超时 . 几 秒 钟 后 终止 输入 。read 会 返回 一 个 非 需 退出 状态 ， 若 输入 超时 。 
-ufd 使 用 文件 描述 符 fd 中 的 输入 ， 而 不 是 标准 输入 。 


使 用 各 种 各 祥 的 选项 ， 我 们 能 用 read 完成 有 趣 的 事情 。 例 如 ， 通 过 -p 选项 ， 我 们 能 够 提供 提示 信息 : 


#!/bin/bash 

# read-single: read multiple values into default variable 
read -p "Enter one or more values >" 

echo "REPLY = '$REPLY" 


通过 -t 和 -s 选项 ， 我 们 可 以 编写 一 个 这 样 的 脚本 ， 读 取 " 秘 密 " 输 入 ， 并 且 如 果 在 特定 的 时 间 内 输入 没有 完成 ， 就 终止 输入 。 


#1!/bin/bash 

# read-secret: input a secret pass phrase 

if read -t 10 -sp "Enter secret pass phrase > " secret_pass; then 
echo -e "\nSecret pass phrase = '$secret pass" 

else 
echo -e "\ninput timed out" >&2 
exit 1 

if 


这 个 脚本 提示 用 户 输入 一 个 密码 ， 并 等 待 输 入 10 秒 钟 。 如 果 在 特定 的 时 间 内 没有 完成 输入 ， 则 脚本 会 退出 并 返回 一 个 错误 。 
因为 包含 了 一 个 -s 选项 ， 所 以 输入 的 密码 不 会 出 现在 屏幕 上 。 


通常 ，shell 对 提供 给 read 的 输入 按照 单词 进行 分 离 。 正 如 我 们 所 见 到 的 ， 这 意味 着 多 个 由 一 个 或 几 个 空格 分 离开 的 单词 在 


输入 行 中 变 成 独立 的 个 体 ， 并 被 read 赋值 给 单独 的 变量 。 这 种 行为 由 shell 变量 /FS (内 部 字符 分 隔 符 ) 配置 。/FS 的 默认 
值 包含 一 个 空格 ， 一 个 tab， 和 一 个 换行 符 ， 每 一 个 都 会 把 字段 分 割 开 。 


我 们 可 以 调整 /FS 的 值 来 控制 输入 字段 的 分 离 。 例 如 ， 这 个 /etc/passwd 文件 包含 的 数据 行 使 用 冒号 作为 字段 分 隔 符 。 通 过 
把 /FS 的 值 更 改 为 单个 冒号 ， 我 们 可 以 使 read 读 取 /etc/passwd 中 的 内 容 ， 并 成 功 地 把 字段 分 给 不 同 的 变量 。 这 个 就 是 做 
这 样 的 事情 : 


#!/bin/bash 
# read-ifs: read fields from a file 
FILE=/etc/passwd 
read -p "Enter a user name > " user_name 
file_info=$(grep "~^$user_name:" $FILE) 
if [ -n "$file_info" ]; then 
IFS=":" read user pw uid gid name home shell <<< "$file_info" 
echo "User = '$user"™ 
echo "UID = '$uid™ 
echo "GID = '$gid™ 
echo "Full Name = '$Nname™ 
echo "Home Dir. = '$home™ 
echo "Shell = '$shell"™" 
else 
echo "No such user '$user name" >&2 
exit 1 
fi 


这 个 脚本 提示 用 户 输入 系统 中 一 个 帐户 的 用 户 名 ， 然 后 显示 在 文件 /etc/passwd/ 文件 中 关于 用 户 记 录 的 不 同 字段 。 这 个 脚本 
包含 两 个 有 趣 的 文本 行 。 第 一 个 是 : 


file_info=$(grep "~^$user_name:" $FILE) 
这 一 行 把 grep 命令 的 输入 结果 赋值 给 变量 fle_info。grep 命 邻 使 用 的 正则 表达 式 确保 用 户 名 只 会 在 /etc/passwd 文件 中 匹 
配 一 个 文本 行 。 


第 二 个 有 意思 的 文本 行 是 : 


IFS=":" read user pw uid gid name home shell <<< "$file_info" 


这 一 行 由 三 部 分 组 成 : 一 个 变量 赋值 ， 一 个 带 有 一 串 参数 的 read 命 舍 ， 和 一 个 奇怪 的 新 的 重 定向 操作 符 。 我 们 首先 看 一 下 
变量 赋值 。 


Shell 允许 在 一 个 命令 之 前 立即 发 生 一 个 或 多 个 变量 赋值 。 这 些 赋 值 为 跟随 着 的 命令 更 改 环境 变量 。 这 个 赋值 的 影响 是 暂时 
的 ; 只 是 在 命令 存在 期 间 改变 环境 变量 。 在 这 种 情况 下 ，IFS 的 值 改 为 一 个 冒号 。 另外 ， 我 们 也 可 以 这 样 编码 : 


OLD_IFS="$IFS" 

IFS=":" 

read user pw uid gid name home shell <<< "$file_info" 
IFS="$OLD_IFS" 


我 们 先 存储 IFS 的 值 ， 然 后 赋 给 一 个 新 值 ， 再 执行 read 命 伟 ， 最 后 把 IFS 恢复 原 值 。 显 然 ， 完 成 相同 的 任务 ， 在 命令 之 前 
放置 变量 名 赋值 是 一 种 更 简明 的 方式 。 
这 个 <<< 操作 符 指示 一 个 here 字符 串 。 一 个 here 字符 串 就 像 一 个 here 文档 ， 只 是 比较 简短 ， 由 单个 字符 串 组 成 。 在 这 


个 例子 中 ， 来 自 /etc/passwd 文件 的 数据 发 送 给 read 命令 的 标准 输入 。 我 们 可 能 想 知道 为 什么 选择 这 种 相当 了 星 涩 的 方法 而 


不 是 : 


echo "$file_info" | IFS=":" read user pw uid gid name home shell 


你 不 能 管道 read 





echo "foo" | read 
虽然 通常 read 命令 接受 标准 输入 ， 但 是 你 不 能 这 样 做 : 


我 们 期 望 这 个 命令 能 生效 ， 但 是 它 不 能 。 这 个 命令 将 显示 成 功 ， 但 是 REPLY 变量 总 是 为 空 。 为 什么 会 这 样 ? 





答案 与 shell 义理 管道 线 的 方式 有 关系 。 在 bash (和 其 它 shells， 例 如 sh) 中 ， 管 道 线 会 创建 子 shell。 它 们 是 shell 
的 副本 ， 且 用 来 执行 命令 的 环境 变量 在 管道 线 中 。 上 面 示例 中 ，read 命令 将 在 子 shell 中 执行 。 








在 类 似 于 Unix 的 系统 中 ， 子 shell 执行 的 时 候 ， 会 为 进程 创建 父 环境 的 副本 。 当 进程 结束 之 后 ， 环 境 副 本 就 会 被 破坏 
掉 。 这 意味 着 一 个 子 shell 永远 不 能 改变 父 进程 的 环境 。read 赋值 变量 ， 然后 会 变 为 环境 的 一 部 分 。 在 上 面 的 例子 
中 ，read 在 它 的 子 shell 环境 中 ， 把 foo 赋值 给 变量 REPLY， 但 是 当 命令 退出 后 ， 子 shell 和 它 的 环境 将 被 破坏 掉 ， 
这 样 赋值 的 影响 就 会 消失 。 


使 用 here 字符 串 是 解决 此 问题 的 一 种 方法 。 另 一 种 方法 将 在 37 章 中 讨论 。 


校正 输入 





从 键 瘟 输 入 这 种 新 技能 ， 带 来 了 领 外 的 编程 挑战 ， 校 正 输入 。 很 多 时 候 ， 一 个 良好 编写 的 程序 与 一 个 拙劣 程序 之 间 的 区 别 就 
是 程序 处 理 意外 的 能 力 。 通 常 ， 意 外 会 以 错误 输入 的 形式 出 现 。 在 前 面 章节 中 的 计算 程序 ， 我 们 已 经 这 样 做 了 一 点 儿 ， 我 们 
检查 整数 值 ， 杜 别 空 值 和 非 数字 字符 。 每 次 程序 接受 输入 的 时 候 ， 执 行 这 类 的 程序 检查 非常 重要 ， 为 的 是 避免 无 效 数据 。 对 
于 由 多 个 用 户 共享 的 程序 ， 这 个 尤为 重要 。 如 果 一 个 程序 只 使 用 一 次 且 只 被 作者 用 来 执行 一 些 特殊 任务 ， 那么 为 了 经 济 利益 
而 忽略 这 些 保 扩 措施， 可 能 会 被 原谅 。 即 使 这 样 ， 如 果 程 序 执行 危险 任务 ， 比 如 说 删除 文件 ， 所 以 最 好 包含 数据 校正 ， 以 防 
万 一 。 


这 里 我 们 有 一 个 校正 各 种 输入 的 示例 程序 : 


#1!/bin/bash 
# read-validate: validate input 
invalid_input () { 
echo "Invalid input '$REPLY™" >&2 
exit 1 
} 
read -p "Enter a single item >" 
# input is empty (invalid) 
[[ -z $REPLY ]] && invalid_input 
# input is multiple items (invalid) 
(( $(echo $REPLY | wc -w) > 1 )) && invalid_input 
# is input a valid filename? 
if [[ $REPLY =~ 人 ^[-[:alnumi:]\._]+$ ]]; then 
echo "'$REPLY' is a valid filename." 
if [[ -e $REPLY ]]; then 
echo "And file '$REPLY' exists." 
else 
echo "However, file '$REPLY' does not exist." 
fi 
# is input a floating point number? 
if [[ $REPLY =~ 人 ^-?[[:digit:]]*\.[[:digit:]]+$ ]]; then 
echo "'$REPLY' is a floating point number." 
else 
echo "'$REPLY' is not a floating point number." 
fi 
# is input an integer? 
if [[ $REPLY =~ 人 -?[[:digit:]]+$ ]]; then 
echo "$REPLY' is an integer." 
else 
echo "$REPLY' is not an integer." 
fi 
else 
echo "The string '$REPLY' is not a valid filename." 
fi 


这 个 脚本 提示 用 户 输入 一 个 数字 。 随 后 ， 分 析 这 个 数字 来 决定 它 的 内 容 。 正 如 我 们 所 看 到 的 ， 这 个 脚本 使 用 了 许多 我 们 已 经 
讨论 过 的 概念 ， 包 括 shell 函数 ， [[ ]] ，(( )) ， 控 制 操作 符 ss ， 以 及 if 和 一些 正则 表达 式 。 


菜单 


一 种 常见 的 交互 类 型 称 为 菜单 驱动 。 在 菜单 驱动 程序 中 ， 呈 现 给 用 户 一 系列 选择 ， 并 要 求 用 户 选 择 一 项 。 例如 ， 我 们 可 以 想 
象 一 个 展示 以 下 信息 的 程序 : 


Please Select': 

1.Display System Information 
2.Display Disk Space 

3.Display Home Space Utilization 
0.Quit 

Enter selection [0-3] > 


使 用 我 们 从 编写 sys_info_page 程序 中 所 学 到 的 知识 ， 我 们 能 够 构建 一 个 菜单 驱动 程序 来 执行 上 述 菜单 中 的 任务 : 


#!/bin/bash 

# read-menu: a menu driven system information program 
clear 

echo" 

Please Select: 


1. Display System Information 
2. Display Disk Space 
3. Display Home Space Utilization 
0. Quit 
read -p "Enter selection [0-3] > " 
if [[ $REPLY =~ 人 [0-3]$ ]]; then 
if [[ $REPLY == 0 ]]; then 
echo "Program terminated." 
exit 
fi 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME" 
uptime 
exit 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 
exit 
fi 
if [[ $REPLY == 3 ]]; then 
if [[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 
else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 
fi 
exit 
fi 
else 
echo "Invalid entry." >&2 
exit 1 
fi 


The presence of multiple ~ exit points in a program is generally a bad idea (it makes 


从 逻辑 上 讲 ， 这 个 脚本 被 分 为 两 部 分 。 第 一 部 分 显示 菜单 和 用 户 输入 。 第 二 部 分 确认 用 户 反馈 ， 并 执行 选择 的 行动 。 注 意 肢 
本 中 使 用 的 exit 命令 。 在 这 里 ， 在 一 个 行动 执行 之 后 ，exit 被 用 来 阻止 脚本 执行 不 必要 的 代码 。 通常 在 程序 中 出 现 多 个 exit 
代码 是 一 个 坏 想法 ( 它 使 程序 逻辑 较 难 理解 ) ， 但 是 它 在 这 个 脚本 中 起 作用 。 


在 这 一 章 中 ， 我 们 向 着 程序 交互 性 返 出 了 第 一 步 ; 允许 用 户 通 过 键 瘟 向 程序 输入 数据 。 使 用 目前 已 经 学 过 的 技巧 ， 有 可 能 编 
写 许 多 有 用 的 程序 ， 比 如 说 特定 的 计算 程序 和 容易 使 用 的 命令 行 工具 前 端 。 在 下 一 章 中， 我 们 将 继续 建立 菜单 驱动 程序 概 
念 ， 让 它 更 完善 。 


友情 提示 


仔细 研究 本 章 中 的 程序 ， 并 对 程序 的 逻辑 结构 有 一 个 完整 的 理解 ， 这 是 非常 重要 的 ， 因 为 即将 到 来 的 程序 会 日 益 复杂 。 作 为 
练习 ， 用 test 命令 而 不 是 [[ ]] 复合 命令 来 重新 编写 本 章 中 的 程序 。 提示 : 使 用 grep 命令 来 计算 正则 表达 式 及 其 退出 状态 。 
这 会 是 一 个 不 错 的 实践 。 
拓展 阅读 

e Bash 参考 手册 有 一 章 关 于 内 部 命令 的 内 容 ， 其 包括 了 read 命令 : 


http:/www.gnu.org/software/bash/manual/bashref.html#Bash-Builtins 


流程 控制 : while/until 循环 


在 前 面 的 章节 中 ， 我 们 开发 了 菜单 驱动 程序 ， 来 产生 各 种 各 样 的 系统 信息 。 虽 然 程 序 能 够 运行 ， 但 它 仍 然 存在 重大 的 可 用 问 
题 。 它 只 能 执行 单一 的 选择 ， 然 后 终止 。 更 糟糕 地 是 ， 如 果 做 了 一 个 无 效 的 选择 ， 程 序 会 以 错误 终止 ， 而 没有 给 用 户 提供 再 
试 一 次 的 机 会 。 如 果 我 们 能 构建 程序 ， 以 致 于 程序 能 够 重复 显示 菜单 ， 而 且 能 一 次 由 一 次 的 选择 ， 直 到 用 户 选择 退出 程序 ， 
这 样 的 程序 会 更 好 一 些 。 


在 这 一 章 中 ， 我 们 将 看 一 个 叫做 循环 的 程序 概念 ， 其 可 用 来 使 程序 的 某 些 部 分 重复 。shell 为 循环 提供 了 三 个 复合 命令。 本 
章 我 们 将 查看 其 中 的 两 个 命 售 ， 随 后 章节 介绍 第 三 个 命令 。 


循环 


日 常生 活 中 充满 了 重复 性 的 活动 。 每 天 去 散步 ， 饮 狗 ， 切 胡 募 卜 ， 所 有 任务 都 要 重复 一 系列 的 步骤 。 让 我 们 以 切 胡 蔓 卜 为 
例 。 如 果 我 们 用 伪 码 表达 这 种 活动 ， 它 可 能 看 起 来 像 这 样 : 


1. 准备 切 菜 板 
2. 准备 菜刀 
3. 把 胡 蔓 卜 放 到 切 菜 板 上 
4. 提起 菜刀 
5. 向 前 推进 胡萝卜 
6. 切 胡 蔓 卜 
7. 如 果 切 完整 个 胡 蔓 个 ， 就 退出 ， 要 不 然 回 到 第 四 步 继 续 执 行 
从 第 四 步 到 第 七 步 形 成 一 个 循环 。 重 复 执行 循环 内 的 动作 直到 满足 条 件 “ 切 完整 个 胡 蔓 卜 "。 


bash 能 够 表达 相似 的 想法 。 比 方 说 我 们 想 要 按照 顺序 从 1 到 5 显示 五 个 数字 。 可 如 下 构造 一 个 bash 脚本 : 


#!/bin/bash 
# while-count: display a series of numbers 
count=1 
while [ $count -le 5 ]; do 
echo $count 
count=$((count + 1)) 
done 
echo "Finished." 


当 执 行 的 时 候 ， 这 个 脚本 显示 如 下 信息 : 
[me@linuxbox ~]$ while-count 


1 
2 
3 
4 
» 
F 


inished. 
while 命令 的 语法 是 : 
while commands; do commands; done 


和 并 一 样 ， while 计算 一 系列 命令 的 退出 状态 。 只 要 退出 状态 为 雾 ， 它 就 执行 循环 内 的 命令 。 在 上 面 的 脚本 中 ， 创 建 了 变量 
count ， 并 初始 化 为 1。 while 命令 将 会 计算 test 命令 的 退出 状态 。 只 要 test 命令 返回 退出 状态 雳 ， 循 环 内 的 所 有 命令 就 会 


执行 。 每 次 循环 结束 之 后 ， 会 重复 执行 test 命令 。 第 六 次 循环 之 后 ， count 的 数值 增加 到 6， test 命令 不 再 返回 退出 状态 
需 ， 且 循环 终止 。 程序 继续 执行 循环 之 后 的 语句 。 


我 们 可 以 使 用 一 个 while 循环 ， 来 提高 前 面 章节 的 read-menu 程序 : 


#1!/bin/bash 
# while-menu: a menu driven system information program 
DELAY=3 # Number of seconds to display results 
while [[ $REPLY != 0 ]]; do 
clear 
cat <<-_EOF_ 
Please Select' 
1. Display System Information 
2. Display Disk Space 
3. Display Home Space Utilization 
Qit 
EQFS 
read -p "Enter selection [0-3] >" 
if [[ $REPLY =~ 人 [0-3]$ ]]; then 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME" 


uptime 
sleep $DELAY 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 
sleep $DELAY 


fi 
if [[ $REPLY == 3 ]]; then 
if [[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 
else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 
fi 
sleep $DELAY 
fi 
else 
echo "Invalid entry." 
sleep $DELAY 
fi 
done 
echo "Program terminated." 


通过 把 菜单 包含 在 while 循环 中 ， 每 次 用 户 选 择 之 后 ， 我 们 能 够 让 程序 重复 显示 菜单 。 只 要 REPLY 不 等 于 "0"， 循 环 就 会 继 
续 ， 菜 单 就 能 显示 ， 从 而 用 户 有 机 会 重新 选择 。 每 次 动作 完成 之 后 ， 会 执行 一 个 sleep 命令 ， 所 以 在 清空 屏幕 和 重新 显示 菜 
单 之 前 ， 程 序 将 会 停顿 几 秒 钟 ， 为 的 是 能 够 看 到 选项 输出 结果 。 一 旦 REPLY 等 于 “0”， 则 表示 选择 了 "退出" 选项， 循环 就 会 
终止 ， 程 序 继续 执行 done 语句 之 后 的 代码 。 


跳出 循环 


bash 提供 了 两 个 内 部 命令 ， 它 们 可 以 用 来 在 循环 内 部 控制 程序 流程 。 这 个 break 命令 立即 终止 一 个 循环 ， 且 程 序 继 续 执 行 
循环 之 后 的 语句 。 这 个 continue 命令 导致 程序 跳 过 循环 中 剩余 的 语句 ， 且 程序 继续 执行 下 一 次 循环 。 这 里 我 们 看 看 采用 了 
break 和 continue 两 个 命令 的 while-menu 程序 版 本 : 


#!/bin/bash 
# while-menu2:a menu driven system information program 
DELAY=3 # Number of seconds to display results 
while true; do 
clear 
cat <<-_EOF_ 
Please Select: 
1. Display System Information 
2. Display Disk Space 
3. Display Home Space Utilization 
Quit 
EOF 
read -p "Enter selection [0-3] >" 
if [[ $REPLY =~ 人 [0-3]$ ]]; then 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME" 
uptime 
sleep $DELAY 
continue 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 
sleep $DELAY 
continue 
fi 
if [[ $REPLY == 3 ]]; then 
if [[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 
else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 
fi 
sleep $DELAY 
continue 
fi 
if [[ $REPLY == 0 ]]; then 
break 
fi 
else 
echo "Invalid entry." 
sleep $DELAY 
fi 
done 
echo "Program terminated." 


在 这 个 脚本 版 本 中 ， 我 们 设置 了 一 个 无 限 循环 (就 是 自己 永远 不 会 终止 的 循环 ) ， 通 过 使 用 true 命令 为 while 提供 一 个 退出 
状态 。 因 为 true 的 退出 状态 总 是 为 震 ， 所 以 循环 永远 不 会 终止 。 这 是 一 个 令 人 惊 讨 的 通用 脚本 编程 技巧 。 因 为 循环 自己 永远 
不 会 结束 ， 所 以 由 程序 员 在 恰当 的 时 候 提供 某 种 方法 来 跳出 循环 。 此 脚本 ， 当 选择 "0" 选 项 的 时 候 ，break 命令 被 用 来 退出 循 
环 。continue 命令 被 包含 在 其 它 选择 动作 的 末尾 ， 为 的 是 更 加 高 效 执行 。 通 过 使 用 continue 命 伟 ， 当 一 个 选项 确定 后 ， 程 
序 会 跳 过 不 需要 的 代码 。 例 如 ， 如 果 选 择 了 选项 "1"， 则 没有 理由 去 测试 其 它 选项 。 


这 个 until 命 邻 与 while 非常 相似 ， 除 了 当 遇 到 一 个 非 需 退出 状态 的 时 候 ， while 退出 循环 ， 而 until 不 退出 。 一 个 until 循环 
会 继续 执行 直到 它 接受 了 一 个 退出 状态 需 。 在 我 们 的 while-count 脚本 中 ， 我 们 继续 执行 循环 直到 count 变量 的 数值 小 于 或 
等 于 5。 我 们 可 以 得 到 相同 的 结果 ， 通 过 在 脚本 中 使 用 until 命令 : 


#!/bin/bash 
# until-count: display a series of numbers 
count=1 
until [ $count -gt 5 ]; do 
echo $count 
count=$((count + 1)) 
done 
echo "Finished." 


通过 把 test 表达 式 更 改 为 $count -gt 5 ， until 会 在 正确 的 时 间 终 止 循环 。 决 定 使 用 while 循环 还 是 until 循环 ， 通 常 是 选择 
一 个 test 可 以 编写 地 很 清楚 的 循环 。 


使 用 循环 读 取 文件 


while 和 until 能 够 处 理 标准 输入 。 这 就 可 以 使 用 while 和 until 处 理 文件 。 在 下 面 的 例子 中 ， 我 们 将 显示 在 前 面 章节 中 使 用 
的 distros.txt 文件 的 内 容 : 


#!/bin/bash 
# while-read: read lines from a file 
while read distro version release; do 
printf "Distro: %s\tVersion: %s\tReleased: %s\n"\ 
$distro \ 
$version \ 
$release 
done < distros.txt 


为 了 重 定向 文件 到 循环 中 ， 我 们 把 重 定向 操作 符 放置 到 done 语句 之 后 。 循 环 将 使 用 read 从 重 定向 文件 中 读 取 字段 。 这 个 
read 命令 读 取 每 个 文本 行 之 后 ， 将 会 退出 ， 其 退出 状态 为 雳 ， 直 到 到 达 文件 末尾 。 到 时 候 ， 它 的 退出 状态 为 非 震 数值 ， 因 此 
终止 循环 。 也 有 可 能 把 标准 输入 管道 到 循环 中 。 





#!/bin/bash 
# while-read2: read lines from a file 
sort -k 1,1 -k 2n distros.txt | while read distro version release; do 
printf "Distro: %s\tVersion: %s\tReleased: %s\n"\ 
$distro \ 
$version \ 
$release 
done 


这 里 我 们 接受 sort 命令 的 标准 输出 ， 然 后 显示 文本 流 。 然 而 ， 因 为 管道 将 会 在 子 shell 中 执行 循环 ， 当 循环 终止 的 时 候 ， 循 
环 中 创建 的 任意 变量 或 赋值 的 变量 都 会 消失 ， 记 住 这 一 点 很 重要 。 


总 结 妆 纳 


通过 引入 循环 ， 和 我 们 之 前 遇 到 的 分 支 ， 子 例 程 和 序列 ， 我 们 已 经 介绍 了 程序 流程 控制 的 主要 类 型 。 bash 还 有 一 些 锦 训 妙 
计 ， 但 它们 都 是 关于 这 些 基本 概念 的 完善 。 


拓展 阅读 

。 Linux 文档 工程 中 的 Bash 初学 者 指南 一 书 中 介绍 了 更 多 的 while 循环 实例 : 
http://tldp.org/LDP/Bash-Beginners-Guide/html/sect_09_02.html 

e Wikipedia 中 有 一 篇 关于 循环 的 文章 ， 其 是 一 篇 比较 长 的 关于 流程 控制 的 文章 中 的 一 部 分 : 


http://en.wikipedia.orgMWwiki/Control_flow#Loops 


bz 轧 

疑难 排解 

随 着 我 们 的 脚本 变 得 越 来 越 复 厅 ， 当 脚本 运行 错误 ， 执 行 结果 出 人 意料 的 时 候 , 我 们 就 应 该 查看 一 下 原因 了 。 在 这 一 章 中 ， 
我 们 将 会 看 一 些 脚 本 中 出 现 地 常见 错误 类 型 ， 同 时 还 会 介绍 几 个 可 以 跟踪 和 消除 问题 的 有 用 技巧 。 

语法 错误 


一 个 普通 的 错误 类 型 是 语法 。 语 法 错误 涉及 到 一 些 shell 语法 元 素 的 拼写 错误 。 大 多 数 情 况 下 ， 这 类 错误 会 导致 shell 拒绝 执 
行 此 脚本 。 





在 以 下 讨论 中 ， 我 们 将 使 用 下 面 这 个 脚本 ， 来 说 明 常见 的 错误 类 型 : 


#1!/bin/bash 
# trouble: script to demonstrate common errors 
number=1 
if[ $number = 1 ]; then 
echo "Number is equal to 1." 
else 
echo "Number is not equal to 1." 
fi 


参看 脚本 内 容 ， 我 们 知道 这 个 脚本 执行 成 功 了 : 


[me@linuxbox ~]$ trouble 
Number is equal to 1. 


丢失 引号 


如 果 我 们 编辑 我 们 的 脚本 ， 并 从 跟随 第 一 个 echo 命令 的 参数 中 ， 删 除 其 末尾 的 双 引 号 : 





#!/bin/bash 
# trouble: script to demonstrate common errors 
number=1 
if[ $number = 1 ]; then 
echo "Number is equal to 1. 
else 
echo "Number is not equal to 1." 
fi 


观察 发 生 了 什么 : 


[me@linuxbox ~]$ trouble 

/home/me/bin/trouble: line 10: unexpected EOF while looking for 
matching ~ ™ 

/home/me/bin/trouble: line 13: syntax error: unexpected end of file 


这 个 脚本 产生 了 两 个 错误 。 有 趣 地 是 ， 所 报告 的 行 号 不 是 引号 被 删除 的 地 方 ， 而 是 程序 中 后 面 的 文本 行 。 我 们 能 知道 为 什 

么 ， 如 果 我 们 跟随 丢失 引号 文本 行 之 后 的 程序 。bash 会 继续 寻找 右 引号 ， 直 到 它 找到 一 个 ， 其 就 是 这 个 紧 随 第 二 个 echo 命 
倒 之 后 的 引号 。 找 到 这 个 引号 之 后 ，bash 变 得 很 困惑 ， 并 且 if 命令 的 语法 被 破坏 了 ， 因 为 现在 这 个 i 语句 在 一 个 用 引号 引 
起 来 的 (但 是 开放 的 ) 字符 串 里 面 。 


在 见长 的 脚本 中 ， 此 类 错误 很 难 找到 。 使 用 带 有 语法 高 亮 的 编辑 器 将 会 帮助 查找 错误 。 如 果 安 装 了 vim 的 完整 版 ， 通过 输入 
下 面 的 命 伟 ， 可 以 使 语法 高 亮 生效 : 


:syntax on 


丢失 或 意外 的 标记 


另 一 个 常见 错误 是 忘记 补 全 一 个 复合 命令， 比如 说 if 或 者 是 while。 让 我 们 看 一 下 ， 如 果 我 们 删除 if 命 命中 测试 之 后 的 分 
号 ， 会 出 现 什么 情况 : 


#1!/bin/bash 
# trouble: script to demonstrate common errors 
number=1 
if[ $number = 1 ] then 
echo "Number is equal to 1." 
else 
echo "Number is not equal to 1." 
fi 


结果 是 这 样 的 : 


[me@linuxbox ~]$ trouble 

/home/me/bin/trouble: line 9: syntax error near unexpected token 
”else' 

/home/me/bin/trouble: line 9: else' 





再 次 ， 错 误 信 息 指 向 一 个 错误 ， 其 出 现 的 位 置 靠 后 于 实际 问题 所 在 的 文本 行 。 所 发 生 的 事情 真是 相当 有 意思 。 我 们 记得 ， if 
能 够 接受 一 系列 命令 ， 并 且 会 计算 列表 中 最 后 一 个 命令 的 退出 代码 。 在 我 们 的 程序 中 ， 我 们 打算 这 个 列表 由 单个 命令 组 成 ， 
即 [， 测 试 的 同义词 。 这 个 [命令 把 它 后 面 的 东西 看 作 是 一 个 参数 列表 。 在 我 们 这 种 情况 下 ， 有 三 个 参数 : $number，=， 和 
]。 由 于 删除 了 分 号 ， 单 词 then 被 添加 到 参数 列表 中 ， 从 语法 上 讲 ， 这 是 合法 的 。 随 后 的 echo 命令 也 是 合法 的 。 它 被 解释 
为 命令 列表 中 的 另 一 个 命令 ， 计 将 会 计算 命令 的 退出 代码 。 接 下 来 遇 到 单词 else， 但 是 它 出 局 了 ， 因 为 shell 把 它 认 定 为 一 
个 保留 字 (对 于 shell 有 特殊 含义 的 单词 ) ， 而 不 是 一 个 命令 名 ， 因 此 报告 错误 信息 。 


预料 不 到 的 展开 


可 能 有 这 样 的 错误 ， 它 们 公会 间歇 性 地 出 现在 一 个 脚本 中 。 有 时 候 这 个 脚本 执行 正常 ， 其 它 时 间 会 失败 ， 这 是 因为 展开 结果 
造成 的 。 如 果 我 们 轨 还 我 们 丢掉 的 分 号 ， 并 把 number 的 数值 更 改 为 一 个 空 变量 ， 我 们 可 以 示范 一 下 : 


#!/bin/bash 
# trouble: script to demonstrate common errors 
number= 
if[$number = 1 ]; then 
echo "Number is equal to 1." 
else 
echo "Number is not equal to 1." 
fi 


运行 这 个 做 了 修改 的 脚本 ， 得 到 以 下 输出 : 


[me@linuxbox ~]$ trouble 
/home/me/bin/trouble: line 7: [: =: unary operator expected 
Number is not equal to 1. 


我 们 得 到 一 个 相当 神秘 的 错误 信息 ， 其 后 是 第 二 个 echo 命令 的 输出 结果 。 这 问题 是 由 于 test 命令 中 number 变量 的 展开 结 
果 造 成 的 。 当 此 命令 : 


[$number= 1] 


经 过 展开 之 后 ，number 变 为 空 值 ， 结 果 就 是 这 样 : 


这 是 无 效 的 ， 所 以 就 产生 了 错误 。 这 ee ( 它 要 求 每 边 都 有 一 个 数值 ) ， 但 是 第 一 个 数值 是 缺失 
的 ， 这 样 test 命令 就 期 望 用 一 J (比如 -z) 来 代替 。 进 一 步 说 ， 因 为 test 命令 运行 失败 了 (由 于 错误 ) ， 这 个 并 
命 合 接 收 到 一 个 非 需 退出 代码 ， 因 此 执行 第 二 个 echo 命 倒 。 


通过 为 test 命令 中 的 第 一 个 参数 添加 双 引 号 ， 可 以 更 正 这 个 问题 : 
["$number" = 11] 
后 当 展开 操作 发 生地 时 候 ， 执 行 结果 将 会 是 这 样 : 
[= 


其 得 到 了 正确 的 参数 个 数 。 除 了 代表 空 字符 串 之 外 ， 引 号 应 该 被 用 于 这 样 的 场合 ， 一 个 要 展开 成 多 单词 字符 串 的 数值 ， 及 其 
包含 说 入 式 空格 的 文件 名 。 


逻辑 错误 


不 同 于 语法 错误 ， 逻 辑 错 误 不 会 阻止 脚本 执行 。 虽 然 脚 本 会 正常 运行 ， 但 是 它 不 会 产生 期 望 的 结果 ， 为 从 于 脚本 的 逻辑 问 
题 。 虽 然 有 不 计 其 数 的 可 能 的 逻辑 错误 ， 但 下 面 是 一 些 在 脚本 中 找到 的 最 常见 的 逻辑 错误 类 型 : 


1. 不 正确 的 条 件 表达 式 。 很 容易 编写 一 个 错误 的 ifthen/else 语句 ， 并 且 执 行 错误 的 逻辑 。 有 时 候 逻 辑 会 被 颠倒 ， 或 者 是 


逻辑 结构 不 完整 。 


2.“ 超 出 一 个 值 " 错 误 。 当 编写 带 有 计数 器 的 循环 语句 的 时 候 ， 为 了 计数 在 恰当 的 点 结束 ， 循 环 语 句 可 能 要 求 从 0 开始 计 
数 ， 而 不 是 从 1 开始 ， 这 有 可 能 会 被 忽视 。 这 些 类 型 的 错误 要 不 导致 循环 计数 太 多 ， 而 “超出 范围 "， 要 不 就 是 过 早 的 结 
束 了 一 次 迭代 ， 从 而 错过 了 最 后 一 次 迭代 循环 。 


3. 意外 情况 。 大 多 数 逻 辑 错 误 来自 于 程序 碰 到 了 程序 员 没 有 预见 到 的 数据 或 者 情况 。 这 也 可 以 包括 出 乎 意料 的 展开 ， 上 比如 
说 一 个 包含 说 入 式 空格 的 文件 名 展开 成 多 个 命令 参数 而 不 是 单个 的 文件 名 。 


防 错 编 程 


当 编 程 的 时 候 ， 验 证 假设 非常 重要 。 这 意味 着 要 仔细 得 计算 脚本 所 使 用 的 程序 和 命令 的 退出 状态 。 这 里 有 个 实例 ， 基 于 一 个 
真实 的 故事 。 为 了 在 一 台 重 要 的 服务 器 中 执行 维护 任务 ， 一 位 不 幸 的 系统 管理 员 写 了 一 个 脚本 。 这 个 脚本 包含 下 面 两 行 代 
码 : 


cd $dir name 
rm 六 





从 本 质 上 来 说 ， 这 两 行 代码 没有 任何 问题 ， 只 要 是 变量 dir_name 中 存储 的 目录 名 字 存 在 就 可 以 。 但 是 如 果 不 是 这 样 会 发 生 
什么 事情 呢 ? 在 那 种 情况 下 ，cd 命令 会 运行 失败 ， 脚本 会 继续 执行 下 一 行 代码 ， 将 会 删除 当前 工作 目录 中 的 所 有 文件 。 完 成 
不 是 期 望 的 结果 ! 由 于 这 种 设计 策略 ， 这 个 倒 才 的 管理 员 销 毁 了 服务 器 中 的 一 个 重要 部 分 。 





让 我 们 看 一 些 能 够 提高 这 个 设计 的 方法 。 首 先 ， 在 cd 命令 执行 成 功 之 后 ， 再 运行 rm 命令 ， 可 能 是 明智 的 选择 。 


cd $dir name SR& rm 


这 样 ， 如 果 cd 命令 运行 失败 后 ，rm 命令 将 不 会 执行 。 这 样 比较 好 ， 但 是 仍然 有 可 能 未 设置 变量 dir_name 或 其 变量 值 为 
空 ， 从 而 导致 删除 了 用 户主 目录 下 面 的 所 有 文件 。 这 个 问题 也 能 够 避免 ， 通 过 检验 变量 dir_name 中 包含 的 目录 名 是 否 真 正 
地 存在 : 


[[ -d$dir name ]] && cd $dir name && rm* 


通常 ， 当 某 种 情况 (比如 上 述 问 题 ) 发 生 的 时 候 ， 最 好 是 终止 脚本 执行 ， 并 对 这 种 情况 提示 错误 信息 : 


if [[ -d$dir name ]]; then 
if cd $dir_name; then 
rene 
else 
echo "cannot cd to '$dir name™ >&2 
exit 1 
fi 
else 
echo "no such directory: '$dir name™" >&2 
exit 1 
fi 


这 里 ， 我 们 检验 了 两 种 情况 ， 一 个 名 字 ， 看 看 它 是 否 为 一 个 真正 存在 的 目录 ， 另 一 个 是 cd 命令 是 否 执行 成 功 。 如 果 任 一 种 


情况 失败 ， 就 会 发 送 一 个 错误 说 明 信 息 到 标准 错误 ， 然 后 脚本 终止 执行 ， 并 用 退出 状态 1 表明 脚本 执行 失败 。 
验证 输入 


一 个 良好 的 编程 习惯 是 如 果 一 个 程序 可 以 接受 输入 数据 ， 那 么 这 个 程序 必须 能 够 应 对 它 所 接受 的 任意 数据 。 这 通常 意味 着 必 
须 非常 仔细 地 得 选 输入 数据 ， 以 确保 只 有 有 效 的 输入 数据 才能 被 程序 用 来 做 进一步 地 处 理 。 在 前 面 章节 中 我 们 学 习 read 命 
今 的 时 候 ， 我 们 遇 到 过 一 个 这 样 的 例子 。 一 个 脚本 中 包含 了 下 面 一 条 测试 语句 ， 用 来 验证 一 个 选择 菜单 : 


[L$REPEY 三 S10-3]$]] 


这 条 测试 语句 非常 明确 。 只 有 当 用 户 输入 是 一 个 位 于 0 到 3 范围 内 (包括 0 和 3) 的 数字 的 时 候 ， 这 条 语句 才 返 回 一 个 0 退 
出 状态 。 而 其 它 任何 输入 概 不 接受 。 有 时 候 编 写 这 类 测试 条 件 非常 具有 挑战 性 ， 但 是 为 了 能 产 出 一 个 高 质量 的 脚本 ， 付 出 还 
是 必要 的 。 


设计 是 时 间 的 函数 





当 我 还 是 一 名 大 学 生 ， 在 学 习 工 业 设计 的 时 候 ， 一 位 明智 的 教授 说 过 一 个 项 目的 设计 程度 是 由 给 定 设计 病 的 时 间 量 来 
决定 的 。 如 果 给 你 五 分 钟 来 设计 一 款 能 够 “ 杀 死 苍蝇 " 的 产品 ， 你 会 设计 出 一 个 苍蝇 拍 。 如 果 给 你 五 个 月 的 时 间 ， 你 可 
能 会 制作 出 激光 制导 的 “ 反 苍蝇 系统 ”。 








同样 的 原理 适用 于 编程 。 有 时候 一 个 “快速 但 粗 烽 " 的 脚本 就 可 以 解决 问题 ， 但 这 个 脚本 只 能 被 其 作者 使 用 一 次 。 这 类 
脚本 很 常见 ， 为 了 节省 气力 也 应 该 被 快速 地 开发 出 来 。 所 以 这 些 脚本 不 需要 太 多 的 注释 和 防 错 检查 。 相 反 ， 如 果 一 个 
脚本 打算 用 于 生产 使 用 ， 也 就 是 说 ， 某 个 重要 任务 或 者 多 个 客户 会 不 断 地 用 到 它 ， 此 时 这 个 脚本 就 需要 非常 着 慎 小 心 
地 开发 了 。 











测试 


在 各 类 软件 开发 中 (包括 脚本 ) ， 测 试 是 一 个 重要 的 环节 。 在 开源 世界 中 有 一 句 谚 语 ，“ 早 发 布 ， 常 发 布 "，” 这 句 谚 语 就 反映 
出 这 个 事实 (测试 的 重要 性 ) 。 通过 提早 和 经 常 发 布 ， 软 件 能 够 得 到 更 多 曝光 去 使 用 和 测试 。 经 验 表 明 如 果 在 开发 周期 的 早 
期 发 现 bug， 那 么 这 些 bug 就 越 容易 定位 ， 而 且 越 能 低 成 本 的 修复 。 


在 之 前 的 讨论 中 ， 我 们 知道 了 如 何 使 用 stubs 来 验证 程序 流程 。 在 脚本 开发 的 最 初 阶段 ， 它 们 是 一 项 有 价值 的 技术 来 检测 我 
们 的 工作 进度 。 


让 我 们 看 一 下 上 面 的 文件 删除 问题 ， 为 了 轻松 测试 ， 看 看 如 何 修改 这 些 代 码 。 测 试 原本 那个 代码 片段 翌 是 危险 的 ， 因 为 它 的 
目的 是 要 删除 文件 ， 但 是 我 们 可 以 修改 代码 ， 让 测试 安全 : 


if [[ -d$dir name ]]; then 
if cd $dir_name; then 
echo rm * # TESTING 
else 
echo "cannot cd to '$dir name" >&2 
exit 1 
fi 
else 
echo "no such directory: '$dir name™" >&2 
exit 1 
fi 
exit # TESTING 





因为 在 满足 出 错 条 件 的 情况 下 代码 可 以 打印 出 有 用 信息 ， 所 以 我 们 没有 必要 再 添加 任何 额外 信息 了 。 最 重要 的 改动 是 仅 在 
rm 命令 之 前 放置 了 一 个 echo 命 舍 ， 为 的 是 把 rm 命令 及 其 展开 的 参数 列表 打印 出 来 ， 而 不 是 执行 实际 的 rm 命令 语句 。 这 
个 改动 可 以 安全 的 执行 代码 。 在 这 段 代 码 的 末尾 ， 我 们 放置 了 一 个 exit 命令 来 结束 测试 ， 从 而 防止 执行 脚本 其 它 部 分 的 代 
码 。 这 个 需求 会 因 脚本 的 设计 不 同 而 变化 。 


我 们 也 在 代码 中 添加 了 一 些 注释 ， 用 来 标记 与 测试 相关 的 改动 。 当 测试 完成 之 后 ， 这 些 注释 可 以 帮助 我 们 找到 并 删除 所 有 的 
更 改 。 
测试 案例 


为 了 执行 有 用 的 测试 ， 开 发 和 使 用 好 的 测试 案例 是 很 重要 的 。 这 个 要 求 可 以 通过 谨慎 地 选择 输入 数据 或 者 运行 边缘 案例 和 极 
端 案例 来 完成 。 在 我 们 的 代码 片段 中 〈 是 非常 简单 的 代码 ) ， 我 们 想 要 知道 在 下 面 的 三 种 具体 情况 下 这 上段 代码 是 怎样 执行 
的 : 

1. dir_name 包含 一 个 已 经 存在 的 目录 的 名 字 

2. dir_name 包含 一 个 不 存在 的 目录 的 名 字 

3. dir_name 为 空 
通过 执行 以 上 每 一 个 测试 条 件 ， 就 达到 了 一 个 良好 的 测试 覆盖 率 。 


正如 设计 ， 测 试 也 是 一 个 时 间 的 函数 。 不 是 每 一 个 脚本 功能 都 需要 做 大 量 的 测试 。 问 题 关 键 是 确定 什么 功能 是 最 重要 的 。 
为 测试 若 发 生 故 障 会 存在 如 此 潜在 的 破坏 性 ， 所 以 我 们 的 代码 片 在 设计 和 测试 段 期 间 都 应 值得 仔细 推 襄 。 


调试 


如 果 测 试 暴露 了 脚本 中 的 一 个 问题 ， 那 下 一 步 就 是 调试 了 。“ 一 个 问题 "通常 意味 着 在 某 种 情况 下 ， 这 个 脚本 的 执行 结果 不 是 
程序 员 所 期 望 的 结果 。 若 是 这 种 情况 ， 我 们 需要 仔细 确认 这 个 脚本 实际 到 底 要 完成 什么 任务 ， 和 为 什么 要 这 样 做 。 有 时 候 查 
找 bug 要 牵涉 到 许多 监测 工作 。 一 个 设计 良好 的 脚本 会 对 查找 错误 有 帮助 。 设 计 和 良好 的 脚本 应 该 具备 防卫 能 力 ， 能 够 监测 异 
常 条 件 ， 并 能 为 用 户 提供 有 用 的 反馈 信息 。 然而 有 时 候 ， 出 现 的 问题 相当 稀奇 ， 出 人 意料 ， 这 时 候 就 需要 更 多 的 调试 技巧 
了 。 


找到 问题 区 域 
在 一 些 脚本 中 ， 尤 其 是 一 些 代码 比较 长 的 脚本 ， 有 时 候 隔离 脚本 中 与 出 现 的 问题 相关 的 代码 区 域 对 查找 问题 很 有 效 。 隔离 的 


代码 区 域 并 不 总 是 真正 的 错误 所 在 ， 但 是 隔离 往往 可 以 深入 了 解 实际 的 错误 原因 。 可 以 用 来 隔离 代码 的 一 项 技巧 是 “添加 注 
释 ”"。 例 如 ， 我 们 的 文件 删除 代码 可 以 修改 成 这 样 ， 从 而 决定 注释 掉 的 这 部 分 代码 是 否 导致 了 一 个 错误 : 


if [[ -d$dir name ]]; then 
if cd $dir_name; then 
rm * 
else 
echo "cannot cd to '$dir name™" >&2 
exit 1 
fi 
# else 
# 
echo "no such directory: '$dir name™" >&2 
## 
exit 1 
fi 


通过 给 脚本 中 的 一 个 逻辑 区 块 内 的 每 条 语句 的 开头 添加 一 个 注释 符号 ， 我 们 就 阻止 了 这 部 分 代码 的 执行 。 然 后 可 以 再 次 执行 


测试 ， 来 看 看 清除 的 代码 是 否 影响 了 错误 的 行为 。 


追踪 


在 一 个 脚本 中 ， 错 误 往 往 是 由 意 想不到 的 逻辑 流 导致 的 。 也 就 是 说 ， 脚 本 中 的 一 部 分 代码 或 者 从 未 执行 ， 或 是 以 错误 的 顺 
序 ， 或 在 错误 的 时 间 给 执行 了 。 为 了 查看 真实 的 程序 流 ， 我 们 使 用 一 项 叫做 追踪 (tracing) 的 技术 。 


一 种 追踪 方法 涉及 到 在 脚本 中 添加 可 以 显示 程序 执行 位 置 的 提示 性 信息 。 我 们 可 以 添加 提示 信息 到 我 们 的 代码 片段 中 : 


echo "preparing to delete files" >&2 
if [[ -d$dir name ]]; then 
if cd $dir_ name; then 
echo "deleting files" >&2 
CEH 
else 
echo "cannot cd to '$dir name"™" >&2 
exit 1 
fi 
else 
echo "no such directory: '$dir name™" >&2 
exit 1 
fi 
echo "file deletion complete" >&2 





我 们 把 提示 信息 输出 到 标准 错误 输出 ， 让 其 从 标准 输出 中 分 离 出 来 。 我 们 也 没有 缩 进 包含 提示 信息 的 语句 ， 这 样 想 要 删除 它 


们 的 时 候 ， 能 比较 容易 找到 它们 。 


当 这 个 脚本 执行 的 时 候 ， 就 可 能 看 到 文件 删除 操作 已 经 完成 了 : 


[me@linuxbox ~]$ deletion-script 
preparing to delete files 

deleting files 
file deletion complete 
[me@linuxbox ~]$ 





bash 还 提供 了 一 种 名 为 追踪 的 方法 ， 这 种 方法 可 通过 -x 选项 和 set 命令 加 上 -x 选项 两 种 途径 实现 。 拿 我 们 之 前 的 trouble 


脚本 为 例 ， 给 该 脚本 的 第 一 行 语句 添加 -x 选项 ， 我 们 就 能 追踪 整个 脚本 。 


#1!/bin/bash -x 
# trouble: script to demonstrate common errors 
number=1 
if[ $number = 1 ]; then 
echo "Number is equal to 1." 
else 
echo "Number is not equal to 1." 
fi 


当 脚本 执行 后 ， 输 出 结果 看 起 来 像 这 样 : 


[me@linuxbox ~]$ trouble 

+ number=1 

onl 

+ echo 'Number is equal to 1. 
Number is equal to 1. 


追踪 生效 后 ， 我 们 看 到 脚本 命令 展开 后 才 执 行 。 行 首 的 加 号 表明 追踪 的 迹象 ， 使 其 与 常规 输出 结果 区 分 开 来 。 加 号 是 追踪 输 
出 的 默认 字符 。 它 包含 在 PS4 (提示 符 4) shell 变量 中 。 可 以 调整 这 个 变量 值 让 提示 信息 更 有 意义 。 这 里 ， 我 们 修改 该 变量 
的 内 容 ， 让 其 包含 脚本 中 追踪 执行 到 的 当前 行 的 行 号 。 注 意 这 里 必须 使 用 单 引 号 是 为 了 防止 变量 展开 ， 直 到 提示 符 真 正 使 用 
的 时 候 ， 就 不 需要 了 。 





[me@linuxbox ~]$ export PS4='$LINENO 十 
[me@linuxbox ~]$ trouble 

5 + number=1 

/| We 

8 + echo 'Number is equal to 1.' 

Number is equal to 1. 


我 们 可 以 使 用 set 命令 加 上 -x 选项 ， 为 脚本 中 的 一 块 选择 区 域 ， 而 不 是 整个 脚本 启用 追踪 。 


#!/bin/bash 
# trouble: script to demonstrate common errors 
number=1 
set -x# Turn on tracing 
if[ $number = 1 ]; then 
echo "Number is equal to 1." 
else 
echo "Number is not equal to 1." 
fi 
set +Xx# Turn off tracing 


我 们 使 用 set 命令 加 上 -x 选项 来 启动 追踪 ，+X 选项 关闭 追踪 。 这 种 技术 可 以 用 来 检查 一 个 有 错误 的 脚本 的 多 个 部 分 。 
执行 时 检查 数值 


伴随 着 追踪 ， 在 脚本 执行 的 时 候 显 示 变 量 的 内 容 ， 以 此 知道 脚本 内 部 的 工作 状态 ， 往 往 是 很 用 的 。 使 用 额外 的 echo 语句 通 


常会 奏效 。 


#!/bin/bash 
# trouble: script to demonstrate common errors 
number=1 
echo "number=$number" # DEBUG 
set -x# Turn on tracing 
if[ $number = 1 ]; then 

echo "Number is equal to 1." 
else 

echo "Number is not equal to 1." 
fi 
set +x# Turn off tracing 


在 这 个 简单 的 示例 中 ， 我 们 只 是 显示 变量 number 的 数值 ， 并 为 其 添加 注释 ， 随 后 利于 其 识别 和 清除 。 当 查 看 脚本 中 的 循环 
和 算术 语句 的 时 候 ， 这 种 技术 特别 有 用 。 


总 结 


SNE 
在 这 一 章 中 ， 我 们 仅仅 看 了 几 个 在 脚本 开发 期 间 会 出 现 的 问题 。 当 然 ， 还 有 很 多 。 这 章 中 描述 的 技术 对 查找 大 多 数 的 常见 错 


误 是 有 效 的。 调试 是 一 种 艺术 ， 可 以 通过 开发 经 验 ， 在 知道 如 何 避 免 错误 (整个 开发 过 程 中 不 断 测试 ) 以 及 在 查找 bug (有 效 
利用 追踪 ) 两 方面 都 会 得 到 提升 。 


拓展 阅读 


。 Wikipedia 上 面 有 两 篇 关于 语法 和 逻辑 错误 的 短文 : 
http://en.wikipedia.org/Wwiki/Syntax_error 
http://en.wikipedia.org/Wwiki/logic_error 

e 网 上 有 很 多 关于 技术 层面 的 bash 编程 的 资源 : 
http:/mywiki.wooledge.org/BashPitfalls 
http:Mldp.org/LDP/abs/html/gotchas.html 
http:/www.gnu.org/software/bash/manual/html_node/Reserved-Word-Index.html 


e。 想 要 学 习 从 编写 良好 的 Unix 程序 中 得 知 的 基本 概念 ， 可 以 参考 Eric Raymond 的 《Unix 编程 的 艺术 》 这 本 伟大 的 著 
作 。 书 中 的 许多 想法 都 能 适用 于 shell 脚本 : 


http:/www.faqs.org/docs/artu/ 
http://www.faqs.org/docs/artu/ch01s06.html 
e 对 于 真正 的 高 强度 的 调试 ， 参 考 这 个 Bash Debugger : 


http://bashdb.sourceforge.net/ 


流程 控制 : case 分 支 


在 这 一 章 中 ， 我 们 将 继续 看 一 下 程序 的 流程 控制 。 在 第 28 章 中 ， 我 们 构建 了 一 些 简单 的 菜单 并 创建 了 用 来 应 对 各 种 用 户 选 择 
的 程序 逻辑 。 为 此 ， 我 们 使 用 了 一 系列 的 if 命 合 来 识别 哪 一 个 可 能 的 选项 已 经 被 选中 。 这 种 类 型 的 构造 经 常 出 现在 程序 中 
出 现 频 率 如 此 之 多 ， 以 至 于 许多 编程 语言 (包括 shell) 专门 为 多 选 决策 提供 了 一 种 流程 控制 机 制 。 


Case 


Bash 的 多 选 复合 命令 称 为 case。 它 的 语法 规则 如 下 所 示 : 


case word in 
[pattern [| pattern]...) commands ;;]... 
esac 


如 果 我 们 看 一 下 第 28 章 中 的 读 菜 单程 序 ， 我 们 就 知道 了 用 来 应 对 一 个 用 户 选 项 的 逻辑 流程 : 


#!/bin/bash 
# read-menu: a menu driven system information program 
clear 
echo " 
Please Select: 
1. Display System Information 
2. Display Disk Space 
3. Display Home Space Utilization 
0. Quit 
read -p "Enter selection [0-3] > " 
if [[ $REPLY =~ 人 [0-3]$ ]]; then 
if [[ $REPLY == 0 ]]; then 
echo "Program terminated." 
exit 
fi 
if [[ $REPLY == 1 ]]; then 
echo "Hostname: $HOSTNAME" 
uptime 
exit 
fi 
if [[ $REPLY == 2 ]]; then 
df -h 
exit 
fi 
if [[ $REPLY == 3 ]]; then 
if [[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 
else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 
fi 
exit 
fi 
else 
echo "Invalid entry." >&2 
exit 1 
fi 


使 用 case 语句 ， 我 们 可 以 用 更 简单 的 代码 珍 换 这 种 逻辑 : 


#!/bin/bash 

# case-menu: a menu driven system information program 
clear 

echo" 

Please Select': 

1. Display System Information 

2. Display Disk Space 

3. Display Home Space Utilization 
0. Quit 

read -p "Enter selection [0-3] > " 
case $REPLY in 

0) echo "Program terminated." 
exit 


1) echo "Hostname: $HOSTNAME" 
uptime 


2) df-h 





if [[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 

else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 


Lu 


fi 


*) echo "Invalid entry" >&2 
exit 1 


esac 


case 命令 检查 一 个 变量 值 ， 在 我 们 这 个 例子 中 ， 就 是 REPLY 变量 的 变量 值 ， 然 后 试图 去 匹配 其 中 一 个 具体 的 模式 。 当 和 与 之 
相 匹 配 的 模式 找到 之 后 ， 就 会 执行 与 该 模式 相关 联 的 命令。 若 找 到 一 个 模式 之 后 ， 就 不 会 再 继续 寻找 。 





模式 
这 里 case 语句 使 用 的 模式 和 路 径 展 开 中 使 用 的 那些 是 一 样 的。 模式 以 一 个 “)" 为 终止 符 。 这 里 是 一 些 有 效 的 模式 。 


表 32-1 : case 模式 实例 
模式 描述 
a) 若 单词 为 “a"， 则 匹配 


[Ealpha:]) 若 单词 是 一 个 字母 字符 ， 则 匹配 


2737) 若 单词 只 有 3 个 字符 ， 则 匹配 

.txt) 若 单词 以 “txt" 字符 结尾 ， 则 匹配 

) 匹配 任意 单词 。 把 这 个 模式 做 为 case 命令 的 最 后 一 个 模式 ， 是 一 个 很 好 的 做 法 ， 可 以 捕捉 到 任意 一 个 
与 先前 模式 不 匹配 的 数值 ; 也 就 是 说 ， 捕 捉 到 任何 可 能 的 无 效 值 。 


这 里 是 一 个 模式 使 用 实例 : 


#!/bin/bash 
read -p "enter word >" 
case $REPLY in 


[[:alpha:]]) echo "is a single alphabetic character." ;; 
[ABC][0-9]) echo "is A,B,orCfollowed by a digit." ;; 
273) echo "is three characters long.";; 
EX echo "is a word ending in ‘txt™ ;; 
) echo "is something else.";; 

esac 


还 可 以 使 用 坚 线 字符 作为 分 隔 符 ， 把 多 个 模式 结合 起 来 。 这 就 创建 了 一 个 “或 " 条 件 模式 。 这 对 于 处 理 诸 如 大 小 写字 符 很 有 用 
处 。 例 如 : 


#!/bin/bash 

# case-menu: a menu driven system information program 
clear 

echo" 

Please Seledt: 

A. Display System Information 

B. Display Disk Space 

C. Display Home Space Utilization 

Q. Quit 


read -p "Enter selection [A, B, Cor Q] >" 
case $REPLY in 
q|Q) echo "Program terminated." 
exit 
A) echo "Hostname: $HOSTNAME" 
uptime 


og 


blB) df -h 





C) if [[ $(id -u) -eq 0 ]]; then 
echo "Home Space Utilization (All Users)" 
du -sh /home/* 
else 
echo "Home Space Utilization ($USER)" 
du -sh $HOME 
fi 


n 


*) echo "Invalid entry" >&2 
exit 1 


a 
这 里 ， 我 们 更 改 了 case-menu 程序 的 代码 ， 用 字母 来 代 蔡 数字 做 为 菜单 选项 。 注 意 新 模式 如 何 使 得 大 小 写字 母 都 是 有 效 的 输 
入 选项 。 
执行 多 个 动作 


早 于 版 本 号 4.0 的 bash，case 语法 只 人 允许 执行 与 一 个 成 功 匹 配 的 模式 相关 联 的 动作 。 匹配 成 功 之 后 ， 命 邻 将 会 终止 。 这 里 我 
们 看 一 个 测试 一 个 字符 的 脚本 : 


#!/bin/bash 
# case4-1: test a character 
read -n 1 -p "Type a character >" 


echo 
case $REPLY in 
[[:upper:]]) echo "'$REPLY' is upper case.",;; 
lower:]]) echo "'$REPLY'is lower case.",;; 
alpha:]]) echo "$REPLY' is alphabetic.";; 


:gigitw]l) ecno SREPIY Sardigite > 

:graph:]]) echo "'$REPLY' is a visible character.",;; 
:punct:]]) echo "'$REPLY'is a punctuation symbol.";; 
:space:]]) echo "'$REPLY'is a whitespace character.";; 
:xdigit:]]) echo "'$REPLY' is a hexadecimal digit.";; 

C 


[[ 
[[ 
[[ 
[[ 
[[ 
[[ 
[[ 
a 


[0 


S 


运行 这 个 脚本 ， 输 出 这 些 内 容 : 


[me@linuxbox ~]$ case4-1 
Type a character > a 
'a'is lower case. 


大 多 数 情况 下 这 个 脚本 工作 是 正常 的 ， 但 若 输 入 的 字符 不 止 与 一 个 POSIX 字符 集 匹 配 的 话 ， 这 时 脚本 就 会 出 错 。 例如 ， 字 
符 “a” 既是 小 写字 母 ， 也 是 一 个 十 六 进 制 的 数字 。 早 于 4.0 的 bash， 对 于 case 话 法 绝 不 能 匹配 多 个 测试 条 件 。 现 在 的 bash 
版 本 ， 添 加 “;;&”" 表达 式 来 终止 每 个 行动 ， 所 以 现在 我 们 可 以 做 到 这 一 点 : 


#!/bin/bash 

# case4-2: test a character 

read -n 1 -p "Type a character >" 

echo 

case $REPLY in 
[[:upper:]]) echo "'$REPLY'is upper case.";;& 
[[:lower:]]) echo "'$REPLY'is lower case." ;;& 
[[:alpha:]]) echo "'$REPLY'is alphabetic." ;;& 
[[:digit:]]) echo "$REPLY' is a digit." ;;& 
[[:graph:]]) echo "'$REPLY'is a visible character." ;;& 
[[:punct:]]) echo "'$REPLY'is a punctuation symbol." ;;& 
[[:space:]]) echo "'$REPLY'is a whitespace character." ;;& 
[[:xdigit:]]) echo "'$REPLY'is a hexadecimal digit." ;;& 

esac 


当 我 们 运行 这 个 脚本 的 时 候 ， 我 们 得 到 这 些 : 


[me@linuxbox ~]$ case4-2 
Type a character > a 

'a'is lower case. 

'a'is alphabetic. 

'a'is a visible character. 
'a'is a hexadecimal digit. 


添加 的 “;;&” 的 语法 允许 case 语句 继续 执行 下 一 条 测试 ， 而 不 是 简 


(Gu 
应 


单 地 终止 运行 。 


bet 中 的 一 个 便捷 工具 。 在 下 一 章 中 我 们 将 看 到 ， 对 于 处 理 某 些 类 


完美 的 工具 。 

拓展 阅读 

e Bash 参考 手册 的 条 件 构造 一 节 详 尽 的 介绍 了 case 命令 : 
http://iswww.case.edu/php/chet/bash/bashref.html#SEC21 


e 高 级 Bash 脚本 指南 提供 了 更 深 一 层 的 case 应 用 实例 : 


http://lidp.org/LDP/abs/html/testbranch.html 


型 的 问题 来 说 ，case 命令 是 


位 置 参数 


现在 我 们 的 程序 还 缺少 一 种 本 领 ， 就 是 接收 和 处理 命 合 行 选项 和 参数 的 能 力 。 在 这 一 章 中 ， 我 们 将 探究 一 些 能 让 程序 访问 命 
合 行 内 容 的 shell 性 能 。 


访问 命令 4 


shell 提供 了 一 个 称 为 位 置 参数 的 变量 集合 ， 这 个 集合 包含 了 命令 行 中 所 有 独立 的 单词 。 这 些 变量 按照 从 0 到 9 给 予 命名 。 可 
以 以 这 种 方式 讲 明白 : 


#!/bin/bash 
# posit-param: script to view command line parameters 
echo " 

\$0 = $0 
\$1 = $1 
\$2 = $2 
\$3= $3 
\$4 = $4 
\$5= $5 
\$6 = $6 
\$7 = $7 
\$8 = $8 


一 个 非常 简单 的 脚本 ， 显 示 从 $0 到 $9 所 有 变量 的 值 。 当 不 带 命令 行 参数 执行 该 脚本 时 ， 输 出 结果 如 下 : 


[me@linuxbox ~]$ posit-param 
$0 = /home/me/bin/posit-param 
$1 = 

$2 


即使 不 带 命令 行 参 数 ， 位 置 参 数 $0 总 会 包含 命令 行 中 出 现 的 第 一 个 单词 ， 也 就 是 已 执行 程序 的 路 径 名 。 当 带 参数 执行 脚本 
时 ， 我 们 看 看 输出 结果 : 


[me@linuxbox ~]$ posit-param a b cd 
$0 = /home/me/bin/posit-param 
$1=a 

$2%= 

@ 

d 


tn 
W 
1 ol, fa) 1 0 WN I! 


注意 : 实际 上 通过 参数 展开 方式 你 可 以 访问 的 参数 个 数 多 于 9 个 。 只 要 指定 一 个 大 于 9 的 数字 ， 用 花 括号 把 该 数字 括 起 来 就 可 
以 。 例如 ${10}，${55}， ${211}， 等 等 。 


确定 参数 个 数 


另外 shell 还 提供 了 一 个 名 为 $#， 可 以 得 到 命 合 行 参数 个 数 的 变量 : 


#!/bin/bash 
# posit-param: script to view command line parameters 


echo " 
Number of arguments: $# 
\$0= $0 
\$1 = $1 
\$2 = $2 
\$3 = $3 
\$4 = $4 
\$5 = $5 
\$6 = $6 
\$7 = $7 
\$8 = $8 
\$9 = $9 
结果 是 


[me@linuxbox ~]$ posit-param a b cd 
Number of arguments: 4 
$0 = /home/me/bin/posit-param 


二 
$2 = 
3 
$4 = d 
$5 = 
$6 = 
$7 = 
$8 = 
$9 = 


shift - 访问 多 个 参数 的 利器 


但 是 如 果 我 们 给 一 个 程序 添加 大 量 的 命令 行 参数 ， 会 怎么 样 呢 ? 正如 下 面 的 例子 : 


NS 


[me@linuxbox ~]$ posit-param * 
Number of arguments: 82 

$0 = /home/me/bin/posit-param 

$1 = addresses.ldif 

$2.=4D1n 

$3 = bookmarks.html 

$4 = debian-500-i386-netinst.iso 
$5 = debian-500-i386-netinst.jigdo 
$6 = debian-500-i386-netinst.template 
$7 = debian-cd_info.tar.gz 

$8 = Desktop 

$9 = dirlist-bin.txt 


在 这 个 例子 运行 的 环境 下 ， 通 配 符 * 展开 成 82 个 参数 。 我 们 如 何 处 理 那么 多 的 参数 ? 为 此 ，shell 提供 了 一 种 方法 ， 尽 管 笨 
拙 ， 但 可 以 解决 这 个 问题 。 执 行 一 次 shift 命令 ， 就 会 导致 所 有 的 位 置 参 数 “向 下 移动 一 个 位 置 "、 事 实 上 ， 用 shift 命令 也 可 
以 处 理 只 有 一 个 参数 的 情况 〈 除 了 其 值 永 远 不 会 改变 的 变量 $0) 


#!/bin/bash 
# posit-param2: script to display all arguments 
count=1 
while [[ $# -gt 0 ]]; do 
echo "Argument $count = $1" 
count=$((count + 1)) 
shift 
done 


每 次 shift 命令 执行 的 时 候 ， 变 量 $2 的 值 会 移动 到 变量 $1 中 ， 变 量 $3 的 值 会 移动 到 变量 $2 中 ， 依 次 类 推 。 变量 9# 的 值 
也 会 相应 的 减 1。 


在 该 posit-param2 程序 中 ， 我 们 编写 了 一 个 计算 剩余 参数 数量 ， 只 要 参数 个 数 不 为 需 就 会 继续 执行 的 while 循环 。 我 们 显 


示 当 前 的 位 置 参数 ， 每 次 循环 迭代 变量 count 的 值 都 会 加 1， 用 来 计数 处 理 的 参数 数量 ， 最 后 ， 执 行 shift 命令 加 载 $1， 其 值 
为 下 一 个 位 置 参数 的 值 。 这 里 是 程序 运行 后 的 输出 结果 : 


[me@linuxbox ~]$ posit-param2 abcd 
Argument 1 = a 
Argument 2 = b 
Argument 3 = < 
Argument 4=d 


简单 应 用 


即使 没有 shift 命 舍 ， 也 可 以 用 位 置 参数 编写 一 个 有 用 的 应 用 。 举 例 说 明 ， 这 里 是 一 个 简单 的 输出 文件 信息 的 程序 : 


#!/bin/bash 
# file_info: simple file information program 
PROGNAME=$(basename $0) 
If ebull ten 
echo -e "\nFile Type:" 
file $1 
echo -e "\nFile Status:" 
stat $1 
else 
echo "$PROGNAME: usage: $PROGNAME file" >&2 
exit 1 
fi 


这 个 程序 显示 一 个 具体 文件 的 文件 类 型 (由 file 命令 确定 ) 和 文件 状态 (来 自 stat 命令 ) 。 该 程序 一 个 有 意思 的 特点 是 
PROGNAME 变量 。 它 的 值 就 是 basename $0 命令 的 执行 结果 。 这 个 basename 命令 清除 一 个 路 径 名 的 开头 部 分 ， 只 留 下 
一 个 文件 的 基本 名 称 。 在 我 们 的 程序 中 ，basename 命令 清除 了 包含 在 $0 位 置 参数 中 的 路 径 名 的 开头 部 分 ，$0 中 包含 着 我 
们 示例 程序 的 完整 路 径 名 。 当 构建 提示 信息 正如 程序 结尾 的 使 用 信息 的 时 候 ，basename $0 的 执行 结果 就 很 有 用 处。 按照 
这 种 方式 编码 ， 可 以 重 命名 该 脚本 ， 且 程序 信息 会 自动 调整 为 包含 相应 的 程序 名 称 。 





Shell 函数 中 使 用 位 置 参数 


正如 位 置 参数 被 用 来 给 shell 脚本 传递 参数 一 样 ， 它 们 也 能 够 被 用 来 给 shell 函数 传递 参数 。 为 了 说 明 这 一 点 ， 我 们 将 把 
file_info 脚本 转变 成 一 个 shell 男 数 : 


file_info () { 
# file_info: function to display file information 
if [ll se $1 1 then 
echo -e "\nFile Type:" 
file $1 
echo -e "\nFile Status:" 
stat $1 
else 
echo "$FUNCNAME: usage: $FUNCNAME file" >&2 
return 1 
fi 
} 


现在 ， 如 果 一 个 包含 shell 函数 fle_info 的 脚本 调用 该 函数 ， 且 带 有 一 个 文件 名 参数 ， 那 这 个 参数 会 传递 给 fle_info 函数 。 
通过 此 功能 ， 我 们 可 以 写 出 许多 有 用 的 shell 函数 ， 这 些 画 数 不 仅 能 在 脚本 中 使 用 ， 也 可 以 用 在 .bashrc 文件 中 。 
注意 那个 PROGNAME 变量 已 经 改 成 shell 变量 FUNCNAME 了 。shell 会 自动 更 新 FUNCNAME 变量 ， 以 便 跟踪 当前 执行 


的 shell 函数 。 注 意 位 置 参数 $0 总 是 包含 命令 行 中 第 一 项 的 完整 路 径 名 (例如 ， 该 程序 的 名 字 ) ， 但 不 会 包含 这 个 我 们 可 能 
期 望 的 shell 函数 的 名 字 。 


处 理 集体 位 置 参 数 





有 时 候 把 所 有 的 位 置 参数 作为 一 个 集体 来 管理 是 很 有 用 的 。 例 如 ， 我 们 可 能 想 为 另 一 个 程序 编写 一 个 “ 包 庄 程序 "。 这 意味 着 


上 号 


我 们 会 创建 一 个 脚本 或 shell 函数 ， 来 简化 另 一 个 程序 的 执行 。 包 应 程序 提供 了 一 个 神秘 的 命令 行 选项 列表 ， 然 后 把 这 个 
数列 表 传递 给 下 一 级 的 程序 。 


为 此 shell 提供 了 两 种 特殊 的 参数 。 他 们 二 者 都 能 扩展 成 完整 的 位 置 参 数列 表 ， 但 以 相当 微妙 的 方式 略 有 不 同 。 它 们 是 : 


表 32-1: 和 @ 特殊 参数 


参数 描述 
展开 成 一 个 从 1 开始 的 位 置 参数 列表 。 当 它 被 用 双 引 号 引起 来 的 时 候 ， 展 开 成 一 个 由 双 引 号 引起 来 的 
$ 字符 串 ， 包 含 了 所 有 的 位 置 参 数 ， 每 个 位 置 参 数 由 shell 变量 IFS 的 第 一 个 字符 (默认 为 一 个 空格 ) 
分 隔 开 。 
$@ 展开 成 一 个 从 1 开始 的 位 置 参数 列表 。 当 它 被 用 双 引 号 引起 来 的 时 候 ， 它 把 每 一 个 位 置 参数 展开 成 一 
个 由 双 引 号 引起 来 的 分 开 的 字符 串 。 


下 面 这 个 脚本 用 程序 中 展示 了 这 些 特 殊 参 数 : 


#!/bin/bash 
# posit-params3 : script to demonstrate $* and $@ 
print_params () { 
echo \$1 = $1" 
echo "\$2 = $2" 
echo "\$3 = $3" 
echo \$4 = $4" 
} 
pass_params (){ 
echo -e "\n" '$* ;', print_params $* 
echoEenAn + :print params 中 *#> 
echo -e \n" '$@ : print _params $@ 
echo -e \n" "$@":; print params "$@" 
} 


pass_params "word" "words with spaces" 


在 这 个 相当 复杂 的 程序 中 ， 我 们 创建 了 两 个 参数 :“word" 和 “words with spaces"， 然 后 把 它们 传递 给 pass_params 男 数 。 
这 个 求 数 ， 依 次 ， 再 把 两 个 参数 传递 给 print_params 画 数 ， 使 用 了 特殊 参数 $* 和 $@ 提供 的 四 种 可 用 方法 。 脚 本 运行 后 ， 
揭示 了 这 两 个 特殊 参数 存在 的 差异 : 





[me@linuxbox ~]$ posit-param3 


Re 

$1 = word 

$2 = words 

$3 = with 

$4 = spaces 

ng* 

$1 = word words with spaces 
$2 = 

$3 = 

$4 = 

$@ : 

$1 = word 

$2 = words 

$3 = with 

$4 = spaces 

"$@": 

$1 = word 

$2 = words with spaces 
$3 = 

$4 = 


通过 我 们 的 参数 ，$* 和 $@ 两 个 都 产生 了 一 个 有 四 个 词 的 结果 : 


word words with spaces 

"$*" produces a one word result: 
"word words with spaces" 

"$@" produces a two word result: 
"word" "words with spaces" 


这 个 结果 符合 我 们 实际 的 期 望 。 我 们 从 中 得 到 的 教训 是 尽管 shell 提供 了 四 种 不 同 的 得 到 位 置 参数 列表 的 方法 ， 但 到 目前 为 
止 ，"$@" 在 大 多 数 情 况 下 是 最 有 用 的 方法 ， 因 为 它 保留 了 每 一 个 位 置 参数 的 完整 性 。 


一 个 更 复杂 的 应 用 
经 过 长 时 间 的 间断 ， 我 们 将 恢复 程序 sys_info_page 的 工作 。 我 们 下 一 步 要 给 程序 添加 如 下 几 个 命令 行 选 项 : 


e 输出 文件 。 我 们 将 添加 一 个 选项 ， 以 便 指定 一 个 文件 名 ， 来 包含 程序 的 输出 结果 。 选项 格式 要 么 是 -ffile， 要 么 是 --file 


file 


e 交互 模式 。 这 个 选项 将 提示 用 户 输入 一 个 输出 文件 名 ， 然 后 判断 是 否 指定 的 文件 已 经 存在 了 。 如 果 文件 存在 ， 在 覆盖 这 
个 存在 的 文件 之 前 会 提示 用 户 。 这 个 选项 可 以 通过 -i 或 者 --interactive 来 指定 。 


。 帮助 。 指 定 -h 选项 或 者 是 --help 选项 ， 可 导致 程序 输出 提示 性 的 使 用 信息 。 


这 里 是 处 理 命 合 行 选项 所 需 的 代码 : 


usage () { 
echo "$PROGNAME: usage: $PROGNAME [-f file | -i]" 
return 
} 
# process command line options 
interactive= 
filename= 
while [[ -n $1 ]]; do 
case $1 in 
-f | --file) shift 


filename=$1 
-i | --interactive) interactive=1 


-h | --help) usage 


exit 
wy Usage >&2 
exit 1 
esac 
shift 
done 





首先 ， 我 们 添加 了 一 个 叫做 usage 的 shell 函数 ， 以 便 显示 帮助 信息 ， 当 启用 帮助 选项 或 敲 写 了 一 个 未 知 选 项 的 时 候 。 


下 一 步 ， 我 们 开始 处 理 循环 。 当 位 置 参 数 $1 不 为 空 的 时 候 ， 这 个 循环 会 持续 运行 。 在 循环 的 底部 ， 有 一 个 shift 命 售 ， 用 来 
提升 位 置 参 数 ， 以 便 确 保 该 循环 最 终 会 终止 。 在 循环 体内 ， 我 们 使 用 了 一 个 case 语句 来 检查 当前 位 置 参数 的 值 ， 看 看 它 是 
否 匹配 某 个 支持 的 选项 。 若 找到 了 匹配 项 ， 就 会 执行 与 之 对 应 的 代码 。 若 没有 ， 就 会 打印 出 程序 使 用 信息 ， 该 脚本 终止 且 执 


行 错误 。 


处 理 -f 参 数 的 方式 很 有 意思 。 当 监测 到 -f 参 数 的 时 候 ， 会 执行 一 次 shift 命 售 ， 从 而 提升 位 置 参数 $1 为 伴随 着 -f 选 项 的 
flename 参数 。 


我 们 下 一 步 添加 代码 来 实现 交互 模式 : 


# interactive mode 
if [[ -n $interactive ]]; then 
while true; do 
read -p "Enter name of output file: " filename 
if [[ -e $filename ]]; then 
read -p "'$filename' exists. Overwrite? [y/n/q] > " 
case $REPLY in 
Yly) break 


Qlq) echo "Program terminated." 
exit 


*) continue 


esac 

elif [[ -z $filename ]]; then 
continue 

else 
break 

fi 

done 
fi 


若 interactive 变量 不 为 空 ， 就 会 启动 一 个 无 休止 的 循环 ， 该 循环 包含 文件 名 提示 和 随后 存在 的 文件 处 理 代 码 。 如 果 所 需要 的 
输出 文件 已 经 存在 ， 则 提示 用 户 履 盖 ， 选 择 另 一 个 文件 名 ， 或 者 退出 程序 。 如 果 用 户 选 择 履 盖 一 个 已 经 存在 的 文件 ， 则 会 执 


行 break 命令 终止 循环 。 注 意 case 语句 是 怎样 只 检测 用 户 选 择 了 覆盖 还 是 退出 选项 。 


示 用 户 再 次 选择 。 
为 了 实现 这 
就 会 明白 这 样 做 的 原因 : 


write_html_page (){ 
cat <<-_EOF_ 
<HTML> 
<HEAD> 
< TLE SSTmTmLE/ANTLES 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIMESTAMP</P> 
$(report_uptime) 
$(report disk space) 
$(report _ home space) 
</BODY> 
</HTML> 
EOF 
return 
. 
# output html page 
if [[ -n $filename ]]; then 
if touch $filename && [[ -f $filename ]]; then 
write_html_page > $filename 
else 
echo "$PROGNAME: Cannot write file '$filename" >&2 
exit 1 
fi 
else 
write_html_page 
fi 


其 它 任何 选择 都 会 导致 循环 继续 并 提 


个 输出 文件 名 的 功能 ， 首 先 我 们 必须 把 现 有 的 这 个 写 页 面 (page-writing) 的 代码 转变 成 一 个 shell 函数 ， 一会儿 


解决 -f 选 项 逻辑 的 代码 出 现在 以 上 程序 片段 的 末尾 。 在 这 段 代码 中 ， 我 们 测试 一 个 文件 名 是 否 存 在 ， 若 文件 名 存在 ， 则 执行 
另 一 个 测试 看 看 该 文件 是 不 是 可 写 文件 。 为 此 ， 会 运行 touch 命 伟 ， 紧 随 其 后 执行 一 个 测试 ， 来 决定 touch 命令 创建 的 文件 
是 否 是 个 普通 文件 。 这 两 个 测试 考虑 到 了 输入 是 无 效 路 径 名 (touch 命令 执行 失败 ) ， 和 一 个 普通 文件 已 经 存在 的 情况 。 


正如 我 们 所 看 到 的 ， 程 序 调用 write_html_page 画 数 来 生成 实际 的 网 页 。 画 数 输出 要 么 直接 定向 到 标准 输出 ( 若 filename 
变量 为 空 的 话 ) 要 么 重 定向 到 具体 的 文件 中 。 


4 


5 


SA 


结 


伴随 着 位 置 参数 的 加 入 ， 现 在 我 们 能 编写 相当 具有 功能 性 的 脚本 。 例 如 ， 重 复 性 的 任务 ， 位 置 参数 使 得 编写 非常 有 用 的 ， 可 
以 放置 在 一 个 用 户 的 .bashrc 文件 中 的 shell 函数 成 为 可 能 。 


我 们 的 sys_info_page 程序 日 渐 精 进 。 这 里 是 一 个 完整 的 程序 清单 ， 最 新 的 更 改 用 高 亮 显示 : 


#!/bin/bash 

# sys_info_page: program to output a system information page 
PROGNAME=$(basename $0) 

TITLE="System Information Report For $HOSTNAME" 

CURRENT TIME=$(date +"%x %r %Z") 

TIMESTAMP="Generated $CURRENT TIME, by $USER" 

report_ uptime () { 





coat 
<H2>System Uptime</H2> 
<PRE>$(uptime)</PRE> 
EQ 
return 
} 
report disk space (){ 
cat<< EQR 
<H2>Disk Space Utilization</H2> 
<PRE>$(df -h)</PRE> 
EOF 
return 
} 
report home space (){ 
if [[ $(id -u) -eq 0 ]]; then 


cat- <> EOF. 
<H2>Home Space Utilization (All Users)</H2> 
<PRE>$(du -sh /home/*)</PRE> 
EQ 
else 
caw aEQFS 
<H2>Home Space Utilization ($USER)</H2> 
<PRE>$(du -sh $HOME)</PRE> 
EQ 
fi 
return 
上 
usage () { 
echo "$PROGNAME: usage: $PROGNAME [-f file | -i]" 
return 
write_html_page (){ 
ca -EOF 
<HTML> 
<HEAD> 
<TITLE>$TITLE</TITLE> 
</HEAD> 
<BODY> 
<H1>$TITLE</H1> 
<P>$TIMESTAMP</P> 
$(report_uptime) 
$(report disk space) 
$(report _ home _ space) 
</BODY> 
</HTML> 
EO 
return 
# process command line options 
interactive= 
filename= 
while [[ -n $1 ]]; do 
case $1 in 
-f | --file) shift 
filename=$1 


-i | --interactive) interactive=1 


-h | --help) usage 
exit 


*) usage >&2 
exit 1 


开 Inreracrlve moae 
if [[ -n $interactive ]]; then 
while true; do 
read -p "Enter name of output file: " filename 
if [[ -e $filename ]]; then 
read -p "'$filename' exists. Overwrite? [y/n/q] > " 
case $REPLY in 
Yly) break 


QIq) echo "Program terminated." 
exit 


和 continue 


esac 
fi 
done 
fi 
# output html page 
if [[ -n $filename ]]; then 
if touch $filename S& [[ -f $filename ]]; then 
write_html_page > $filename 
else 
echo "$PROGNAME: Cannot write file '$filename" >&2 
exit 1 
fi 
else 
write_html_page 
fi 


我 们 还 没有 完成 。 仍 然 还 有 许多 事情 我 们 可 以 做 ， 可 以 改进 。 
拓展 阅读 
e Bash Hackers Wiki 上 有 一 篇 不 错 的 关于 位 置 参 数 的 文章 : 
http://wiki.bash-hackers.org/scripting/posparams 
e Bash 的 参考 手册 有 一 篇 关于 特殊 参数 的 文章 ， 包 括 $* 和 $@ : 
http:/www.gnu.org/software/bash/manual/bashref.html#Special-Parameters 


e。 除了 本 章 讨论 的 技术 之 外 ，bash 还 包含 一 个 叫做 getopts 的 内 部 命 舍 ， 此 命令 也 可 以 用 来 处 理 命令 行 参数 。 bash 参考 
页 面 的 SHELL BUILTIN COMMANDS 一 节 介 绍 了 这 个 命令 ，Bash Hackers Wiki 上 也 有 对 它 的 描述 : 


http://wiki.bash-hackers.org/howto/getopts_tutorial 


流程 控制 : for 循环 


在 这 关于 流程 控制 的 最 后 一 章 中 ， 我 们 将 看 看 另 一 种 shell 循环 构造 。for 循环 不 同 于 while 和 until 循环 ， 因 为 在 循环 中 ， 
它 提供 了 一 种 处 理 序列 的 方式 。 这 证 明 在 编程 时 非常 有 用 。 因 此 在 bash 脚本 中 ，for 循环 是 非常 流行 的 构造 。 


实现 一 个 for 循环， 很 自然 的 ， 要 用 for 命令 。 在 现代 版 的 bash 中 ， 有 两 种 可 用 的 for 循环 格式 。 


for: 传统 shell 格式 


原来 的 for 命令 语法 是 : 


for variable [in words]; do 
commands 
done 





这 里 的 variable 是 一 个 变量 的 名 字 ， 这 个 变量 在 循环 执行 期 间 会 增加 ，words 是 一 个 可 选 的 条 目 列表 ， 其 值 会 按 顺 序 赋 值 给 
variable，commands 是 在 每 次 循环 迭代 中 要 执行 的 命令 。 


在 命令 行 中 for 命令 是 很 有 用 的 。 我 们 可 以 很 容易 的 说 明 它 是 如 何 工 作 的 : 


[me@linuxbox ~]$foriinABCDi;doecho $i; done 


A 
B 
(@ 
D 


在 这 个 例子 中 ，for 循环 有 一 个 四 个 单词 的 列表 :“A”，“B”,，“C”， 和 “D”。 由 于 这 四 个 单词 的 列表 ，for 循环 会 执行 四 次 。 每 
次 循环 执行 的 时 候 ， 就 会 有 一 个 单词 赋值 给 变量 i。 在 循环 体内 ， 我 们 有 一 个 echo 命令 会 显示 i 变量 的 值 ， 来 演示 赋值 结 
果 。 正如 while 和 until 循环 ，done 关键 字 会 关闭 循环 。 


for 命令 真正 强大 的 功能 是 我 们 可 以 通过 许多 有 趣 的 方式 创建 words 列表 。 例 如 ， 通 过 花 括 号 展开 : 


[me@linuxbox ~]$foriin {A..D}; do echo $i; done 


A 
B 
全 
D 


或 者 路 径 名 展开 : 


[me@linuxbox ~]$ for i in distros*.txt; do echo $i; done 
distros-by-date .txt 

distros-dates.txt 

distros-key-names.txt 

distros-key-vernums.txt 

distros-names.txt 

distros.txt 

distros-vernums.txt 

distros-versions.txt 


或 者 命令 蔡 换 : 


#!/bin/bash 
# longest-word : find longest string in a file 
while [[ -n $1 ]]; do 
i ler $I], tiren 
max_word= 
max_len=0 
foriin $(strings $1); do 
len=$(echo $i | wc -c) 
if (( len > max_len )); then 
max_len=$len 
max_word=$i 
fi 
done 
echo "$1: '$max_word' ($max_len characters)" 
fi 
shift 
done 


在 这 个 示例 中 ， 我 们 要 在 一 个 文件 中 查找 最 长 的 字符 串 。 当 在 命令 行 中 给 出 一 个 或 多 个 文件 名 的 时 候 ， 该 程序 会 使 用 strings 
程序 (其 包含 在 GNU binutils 包 中 ) ， 为 每 一 个 文件 产生 一 个 可 读 的 文本 格式 的 “words” 列表 。 然后 这 个 for 循环 依次 义理 
每 个 单词 ， 判 断 当 前 这 个 单词 是 否 为 目前 为 止 找 到 的 最 长 的 一 个 。 当 循环 结束 的 时 候 ， 显 示 出 最 长 的 单词 。 


如 果 省 略 掉 for 命 合 的 可 选项 words 部 分 ，for 命令 会 默认 义理 位 置 参数 。 我 们 将 修改 longest-word 脚本 ， 来 使 用 这 种 方 
式 : 


#!/bin/bash 
# longest-word2 : find longest string in a file 
fori; do 
if [[ -r $i ]]; then 
max_word= 
max_len=0 
forj in $(strings $i); do 
len=$(echo $j | wc -c) 
if (( len > max_len )); then 
max_len=$len 
max_word=$j 
fi 
done 
echo "$i: $max_word' ($max_len characters)" 
fi 
done 


正如 我 们 所 看 到 的 ， 我 们 已 经 更 改 了 最 外 围 的 循环 ， 用 for 循环 来 代替 while 循环 。 通 过 省 略 for 命令 的 words 列表 ， 用 位 
置 参 数 替 而 代 之 。 在 循环 体内 ， 之 前 的 变量 i 已 经 改 为 变量 j。 同 时 shift 命令 也 被 淘汰 掉 了 。 


为 什么 是 i? 





你 可 能 已 经 注意 到 上 面 所 列举 的 for 循环 的 实例 都 选择 i 作为 变量 。 为 什么 呢 ? 实际 上 没有 具体 原因 ， 除 了 传统 习惯。 
for 循环 使 用 的 变量 可 以 是 任意 有 效 的 变量 ， 但 是 i 是 最 常用 的 一 个 ， 其 次 是 j 和 k。 









































这 一 传统 的 基础 源 于 Fortran 编程 语言 。 在 Fortran 语言 中 ， 以 字母 |，J，K，L 和 M 开头 的 未 声明 变量 的 类 型 自动 设 
为 整形 ， 而 以 其 它 字 母 开头 的 变量 则 为 实数 类 型 ( 带 有 小 数 的 数字 ) 。 这 种 行为 导致 程序 员 使 用 变量 1，J， 和 K 作为 
循环 变量 ， 因为 当 需 要 一 个 临时 变量 (正如 循环 变量 ) 的 时 候 ， 使 用 它们 工作 量 比较 少 。 这 也 引出 了 如 下 基于 fortran 





























“ 神 是 真实 的 ， 除 非 是 声明 的 整数 。， 
for: C 语言 格式 


最 新 版 本 的 bash 已 经 添加 了 第 二 种 格式 的 for 命令 语法 ， 该 语法 相似 于 C 语言 中 的 for 语法 格式 。 其 它 许多 编程 语言 也 支持 
种 格式 : 


贷 


for (( expression1; expression2; expression3 )); do 
commands 
done 


这 里 的 expression1，expression2， 和 expression3 都 是 算术 表达 式 ，commands 是 每 次 循环 迭代 时 要 执行 的 命令 。 在 行 
为 方面 ， 这 相当 于 以 下 构造 形式 : 


(( expression1l )) 

while (( expression2 )); do 
commands 
(( expression3 )) 

done 


expression1 用 来 初始 化 循环 条 件 ，expression2 用 来 决定 循环 结束 的 时 间 ， 还 有 在 每 次 循环 迭代 的 末尾 会 执行 
expression3。 


这 里 是 一 个 典型 应 用 : 


#!/bin/bash 
# simple_counter : demo of C style for command 
for ((i=0; i<5; i=i+1 )); do 
echo $i 
done 


脚本 执行 之 后 ， 产 生 如 下 输出 : 


[me@linuxbox ~]$ simple_counter 


0 
1 
2 
过 
4 


在 这 个 示例 中 ，expression1 初始 化 变量 i 的 值 为 0，expression2 允许 循环 继续 执行 只 要 变量 i 的 值 小 于 5， 还 有 每 次 循环 迭 
代 时 ，expression3 会 把 变量 i 的 值 加 1。 


C 语言 格式 的 for 循环 对 于 需要 一 个 数字 序列 的 情况 是 很 有 用 处 的 。 我 们 将 在 接 下 来 的 两 章 中 看 到 几 个 这 样 的 应 用 实例 。 


总 结 


NA 





学 习 了 for 命令 的 知识 ， 现 在 我 们 将 对 我 们 的 sys_info_page 脚本 做 最 后 的 改进 。 目前 ， 这 个 report_home_space 函数 看 
起 来 像 这 样 : 


report home space (){ 

if [[ $(id -u) -eq 0 ]]; then 
cat < EOF 
<H2>Home Space Utilization (All Users)</H2> 
<PRE>$(du -sh /home/*)</PRE> 
EQFS 

else 
cot- EORS 
<H2>Home Space Utilization ($USER)</H2> 
<PRE>$(du -sh $HOME)</PRE> 
EEQB 

fi 

return 


} 








下 一 步 ， 我 们 将 重 写 它 ， 以 便 提 供 每 个 用 户主 目录 的 更 详尽 信息 ， 并 且 包含 用 户主 目录 中 文件 和 目录 的 总 个 数 : 


report_home_space () 
local format="%8s%10s%10s\n" 
local i dir_list total files total_dirs total_size user_name 
if [[ $(id -u) -eq 0 ]]; then 
dir_list=/home/* 
user_name="All Users" 
else 
dir_list=$HOME 
user_name=$USER 
fi 
echo "<H2>Home Space Utilization ($user_name)</H2>" 
fori in $dir_list; do 
total files=$(find $i -type f | wc -I) 
total_dirs=$(find $i -type d | wc -I) 
total_size=$(du -sh $i | cut -f 1) 
echo "<H3>$i</H3>" 
echo "<PRE>" 
printf "$format" "Dirs" "Files" "Size" 
printf "$format® "----" "~" "----" 
printf "$format" $total_dirs $total files $total_size 
echo "</PRE>" 
done 
return 


这 次 重 写 应 用 了 目前 为 止 我 们 学 过 的 许多 知识 。 我 们 仍然 测试 超级 用 户 (superuser) ， 但 是 我 们 在 if 语句 块 内 设置 了 一 些 
随后 会 在 for 循环 中 用 到 的 变量 ， 来 取代 在 if 语句 块 内 执行 完备 的 动作 集合 。 我 们 添加 了 给 画 数 添加 了 几 个 本 地 变量 ， 并 且 
使 用 printf 来 格式 化 输出 。 


拓展 阅读 
e 《高 级 Bash 脚本 指南 》 有 一 章 关于 循环 的 内 容 ， 其 中 列举 了 各 种 各 样 的 for 循环 实例 : 
http://tldp.org/LDP/abs/html/loops1.html 
e 《Bash 参考 手册 》 描 述 了 循环 复合 命令 ， 包 括 了 for 循环 : 


http:/www.gnu.org/software/bash/manual/bashref.html#Looping-Constructs 


字符 串 和 数字 


所 有 的 计算 机 程序 都 是 用 来 和 数据 打交道 的 。 在 过 去 的 章节 中 ， 我 们 专注 于 义理 文件 级 别 的 数据 。 然而 ， 许 多 程序 问题 需要 
使 用 更 小 的 数据 单位 来 解决 ， 上 比方 说 字符 串 和 数字 。 


在 这 一 章 中 ， et a nn shell 功能 。shell 提供 了 各 种 执行 字符 串 操作 的 参数 展开 功能 。 除了 
算术 展开 〈 在 第 七 章 中 接触 过 ) ， 还 有 一 个 常见 的 命令 行程 序 叫做 bc， 能 执行 更 高 级 别 的 数学 运算 。 


参数 展开 


尽管 参数 展开 在 第 七 章 中 出 现 过 ， 但 我 们 并 没有 详尽 地 介绍 它 ， 因 为 大 多 数 的 参数 展开 会 用 在 脚本 中 ， 而 不 是 命令 行 中 。 我 
们 已 经 使 用 了 一 些 形式 的 参数 展开 ; 例如 ，shell 变量 。shell 提供 了 更 多 方式 。 


基本 参数 

最 简单 的 参数 展开 形式 反映 在 平常 使 用 的 变量 上 。 例 如 : 

$a 

当 $a 展开 后 ， 会 变 成 变量 a 所 包含 的 值 。 简 单 参数 也 可 能 用 花 括号 引起 来 : 
${a} 


虽然 这 对 展开 没有 影响 ， 但 若 该 变量 a 与 其 它 的 文本 相 邻 ， 可 能 会 把 shell 搞 糊涂 了 。 在 这 个 例子 中 ， 我 们 试图 创建 一 个 文 
件 名 ， 通 过 把 字符 串 “ file” 附加 到 变量 a 的 值 的 后 面 。 


[me@linuxbox ~]$ a="foo" 
[me@linuxbox ~]$ echo "$a _file" 


如 果 我 们 执行 这 个 序列 ， 没 有 任何 输出 结果 ， 因 为 shell 会 试 着 展开 一 个 称 为 a_file 的 变量 ， 而 不 是 a。 通过 添加 花 括号 可 
以 解决 这 个 问题 : 


[me@linuxbox ~]$ echo "${a} file" 
foo file 


我 们 已 经 知道 通过 把 数字 包 囊 在 花 括号 中 ， 可 以 访问 大 于 9 的 位 置 参 数 。 例 如 ， 访 问 第 十 一 个 位 置 参 数 ， 我 们 可 以 这 样 做 : 
${11} 

管理 空 变 量 的 展开 

几 种 用 来 处 理 不 存在 和 空 变量 的 参数 展开 形式 。 这 些 展开 形式 对 于 解决 丢失 的 位 置 参 数 和 给 参数 指定 默认 值 的 情况 很 方便 。 
${parameter:-word} 


若 parameter 没有 设置 (例如 ， 不 存在 ) 或 者 为 空 ， 展 开 结 果 是 word 的 值 。 若 parameter 不 为 空 ， 则 展开 结果 是 
parameter 的 值 。 


[me@linuxbox ~ 


[me@linuxbox ~] 


if unset 
substitute value 
[me@linuxbox ~ 
[me@linuxbox ~ 
[me@linuxbox ~ 
bar 
[me@linuxbox ~ 
bar 


$ foo= 
$ echo ${foo:-"substitute value if unset"} 


$ echo $foo 
$ foo=bar 
$ echo ${foo:-"substitute value if unset"} 





$ echo $foo 


${parameter:=word} 


若 parameter 没有 设置 或 为 空 ， 


展开 结果 是 word 的 值 。 另 外 ， 


开 结 果 是 parameter 的 值 。 


me@linuxbox ~ 
me@linuxbox ~ 


me@linuxbox ~ 


me@linuxbox ~ 
[me@linuxbox ~ 
bar 
[me@linuxbox ~ 
bar 





$ foo= 
$ echo ${foo:="default value if unset"} 


default value if unset 


$ echo $foo 


default value if unset 


$ foo=bar 
$ echo ${foo:="default value if unset"} 





$ echo $foo 


: 位 置 参 数 或 其 它 的 特殊 参数 不 能 以 这 种 方式 赋值 。 


${parameter:?word} 


word 的 值 会 赋值 给 parameter。 若 parameter 不 为 空 ， 


展 


若 parameter 没有 设置 或 为 空 ， 这 种 展开 导致 脚本 带 有 错误 退出 ， 并 且 word 的 内 容 会 发 送 到 标准 错误 。 若 parameter 不 为 
空 ， 展开 结果 是 parameter 的 值 。 


me@linuxbox ~ 
me@linuxbox ~ 


[me@linuxbox ~ 
I 
me@linuxbox ~ 


bar 
me@linuxbox ~ 
0 





bash: foo: param 


[me@linuxbox ~] 


$ foo= 

$ echo ${foo:?"parameter is empty"} 
eter is empty 

$ echo $7? 


$ foo=bar 
$ echo ${foo:?"parameter is empty"} 





$ echo $7? 


${parameter:+word} 


若 parameter 没有 设置 或 为 空 ， 展 开 结 果 为 空 。 若 parameter 不 为 空 ， 


而 ，parameter 的 


[me@linuxbox ~ 
[me@linuxbox ~ 


[me@linuxbox ~ 
[me@linuxbox ~ 
substitute value 


值 不 会 改变 。 


中 TO 三 
$ echo ${foo:+"substitute value if set"} 





$ foo=bar 
$ echo ${foo:+"substitute value if set"} 
if set 


返回 变量 名 的 参数 展开 


shell 具 


返回 变量 名 的 能 力 。 这 会 用 在 一 些 相当 独特 的 情况 下 。 


展开 结果 是 word 的 值 会 蔡 换 掉 parameter 的 值 ; 然 


${!prefix*} 
${!prefix@} 
这 种 展开 会 返回 以 prefix 开头 的 已 有 变量 名 。 根 据 bash 文档 ， 这 两 种 展开 形式 的 执行 结果 相同 。 这 里 ， 我 们 列 出 了 所 有 以 


BASH 开头 的 环境 变量 名 : 


[me@linuxbox ~]$ echo ${!BASH*} 

BASH BASH _ARGC BASH_ARGV BASH_COMMAND BASH_ COMPLETION 
BASH_COMPLETION_DIR BASH_LINENO BASH SOURCE BASH_ SUBSHELL 
BASH VERSINFO BASH_ VERSION 


字符 串 展 开 
有 大 量 的 展开 形式 可 用 于 操作 字符 串 。 其 中 许多 展开 形式 尤其 适用 于 路 径 名 的 展开 。 
${#parameter} 


展开 成 由 parameter 所 包含 的 字符 串 的 长 度 。 通 常 ，parameter 是 一 个 字符 串 ; 然而 ， 如 果 parameter 是 @ 或 者 是 * 的 
话 ， 则 展开 结果 是 位 置 参 数 的 个 数 。 


[me@linuxbox ~]$ foo="This string is long." 
[me@linuxbox ~]$ echo "'$foo' is ${#fo0} characters long." 
'This string is long.'is 20 characters long. 


${parameter:offset} 
${parameter:offset:length} 


这 些 展开 用 来 从 parameter 所 包含 的 字符 串 中 提取 一 部 分 字符 。 提 取 的 字符 始 于 第 offset 个 字符 (从 字符 串 开头 算 起 ) 直到 
字符 串 的 末尾 ， 除 非 指定 提取 的 长 度 。 


[me@linuxbox ~]$ foo="This string is long." 
[me@linuxbox ~]$ echo ${foo:5} 

string is long. 

[me@linuxbox ~]$ echo ${foo:5:6} 

string 





若 offset 的 值 为 负数 ， 则 认为 offset 值 是 从 字符 串 的 末尾 开始 算 起 ， 而 不 是 从 开头 。 注 意 负 数 前 面 必须 有 一 个 空格 ， 为 防止 
与 $fparameter-word} 展开 形式 混淆 。length， 若 出 现 ， 则 必须 不 能 小 于 需 。 


如 果 parameter 是 @， 展 开 结 果 是 length 个 位 置 参数 ， 从 第 offset 个 位 置 参数 开始 。 


[me@linuxbox ~]$ foo="This string is long." 
[me@linuxbox ~]$ echo ${foo: -5} 

long. 

[me@linuxbox ~]$ echo ${foo: -5:2} 

lo 


${parameter#pattern} 
${parameter##pattern} 
这 些 展开 会 从 paramter 所 包含 的 字符 串 中 清除 开头 一 部 分 文本 ， 这 些 字符 要 匹配 定义 的 patten。pattern 是 通配符 模式 ， 就 


如 那些 用 在 路 径 名 展开 中 的 模式 。 这 两 种 形式 的 差异 之 处 是 该 # 形式 清除 最 短 的 匹配 结果 ， 而 该 ## 模式 清除 最 长 的 匹配 结 
果 。 


[me@linuxbox ~]$ foo=file.txt.zip 
[me@linuxbox ~]$ echo ${foo#*.} 
txt.zip 

[me@linuxbox ~]$ echo ${foo##*.} 
zip 


${parameter%pattern} 


${parameter%%pattern} 


这 些 展开 和 上 面 的 # 和 # 展开 一 样 ， 除 了 它们 清除 的 文本 从 parameter 所 包含 字符 串 的 末尾 开始 ， 而 不 是 开头 。 


[me@linuxbox ~]$ foo=file.txt.zip 
[me@linuxbox ~]$ echo ${foo%.*} 
file.txt 

[me@linuxbox ~]$ echo ${foo%%.*} 
file 


${parameter/pattern/string} 
${parameter//pattern/string} 
${parameter/#pattern/string} 


${parameter/%pattern/string} 


这 种 形式 的 展开 对 parameter 的 内 容 执 行 查找 和 蔡 换 操作 。 如 果 找 到 了 匹配 通配符 pattern 的 文本 ， 则 用 string 的 内 容 替 换 
它 。 在 正常 形式 下 ， 只 有 第 一 个 匹配 项 会 被 替换 掉 。 在 该 // 形 式 下 ， 所 有 的 匹配 项 都 会 被 替换 掉 。 该 内 要 求 匹配 项 出 现在 字 


符 串 的 开头 ， 而 /% 要 求 匹配 项 出 现在 字符 串 的 末尾 。/string 可 


[me@linuxbox~]$ foo=JPG.JPG 
[me@linuxbox ~]$ echo ${foo/JPG/jpg} 
jpgJPG 

[me@linuxbox~]$ echo ${foo//JPG/jpg} 
jpg.jpg 

[me@linuxbox~]$ echo ${foo/#]JPG/jpg} 
jpgJPG 

[me@linuxbox~]$ echo ${foo/%jJPG/ipg} 
JPG.jpg 


知道 参数 展开 是 件 很 好 的 事情 。 字 符 串 操作 展开 可 以 用 来 蔡 换 其 它 常 


省 略 掉 ， 这 样 会 导致 删除 匹配 的 文本 。 


见 命令 比方 说 sed 和 cut。 通过 减少 使 用 外 部 程序 ， 展 


开 提 高 了 脚本 的 效率 。 举 例 说 明 ， 我 们 将 修改 在 之 前 章节 中 讨论 的 longest-word 程序 ， 用 参数 展开 ${ 才 } 取代 命令 $(echo 


$j | wc -c) 及 其 subshell ， 像 这 样 : 


#!/bin/bash 
# longest-word3 : find longest string in a file 
fori; do 
if [[ -r $i ]]; then 
max_word= 
max_len= 
forj in $(strings $i); do 
len=${#j} 
if (( len > max_len )); then 
max_len=$len 
max_word=$j 
fi 
done 
echo "$i: $max_word' ($max_len characters)" 
fi 
shift 
done 


下 一 步 ， 我 们 将 使 用 time 命令 来 比较 这 两 个 脚本 版 本 的 效率 : 


[me@linuxbox ~]$ time longest-word2 dirlist-usr-bin.txt 
dirlist-usr-bin.txt: 'scrollkeeper-get-extended-content-list' (38 
characters) 

real Om3.618s 

user 0m1.544s 

sys 0m1.768s 

[me@linuxbox ~]$ time longest-word3 dirlist-usr-bin.txt 
dirlist-usr-bin.txt: 'scrollkeeper-get-extended-content-list' (38 
characters) 

real 0m0.060s 

user 0m0.056s 

sys 0m0.008s 


原来 的 脚本 扫描 整个 文本 文件 需 耗 时 3.168 秒 ， 而 该 新 版 本 ， 使 用 参数 展开 ， 仅 仅 花 费 了 0.06 秒 一 一 一 个 非常 巨大 的 提高 。 
大 小 写 转 换 

最 新 的 bash 版 本 已 经 支持 字符 串 的 大 小 写 转换 了 。bash 有 四 个 参数 展开 和 delare 命令 的 两 个 选项 来 支持 大 小 写 转 换 。 
那么 大 小 写 转 换 对 什么 有 好 处 呢 ? 除了 明显 的 审美 价值 ， 它 在 编程 领域 还 有 一 个 重要 的 角色 。 让 我 们 考虑 一 个 数据 库 查询 的 
案例 。 假 设 一 个 用 户 已 经 融 写 了 一 个 字符 串 到 数据 输入 框 中 ， 而 我 们 想 要 在 一 个 数据 库 中 查找 这 个 字符 串 。 该 用 户 输入 的 字 
符 串 有 可 能 全 是 大 写字 母 或 全 是 小 写 或 是 两 者 的 结合 。 我 们 当然 不 希望 把 每 个 可 能 的 大 小 写 拼写 排列 填充 到 我 们 的 数据 库 


中 。 那 怎么 办 ? 


解决 这 个 问题 的 常见 方法 是 规范 化 用 户 输入 。 也 就 是 ， 在 我 们 试图 查询 数据 库 之 前 ， 把 用 户 的 输入 转换 成 标准 化 。 我 们 能 做 
到 这 一 点 ， 通 过 把 用 户 输入 的 字符 全 部 转换 成 小 写字 母 或 大 写字 母 ， 并 且 确 保 数据 库 中 的 条 目 按 同样 的 方式 规范 化 。 








这 个 declare 命令 可 以 用 来 把 字符 串 规范 成 大 写 或 小 写字 符 。 使 用 declare 命令， 我 们 能 强制 一 个 变量 总 是 包含 所 需 的 格 
式 ， 无 论 如 何 赋值 给 它 。 


#!/bin/bash 
# ul-declare: demonstrate case conversion via declare 
declare -u upper 
declare -| lower 
if [[ $1 ]]; then 
upper="$1" 
lower="$1" 
echo $upper 
echo $lower 
fi 


在 上 面 的 脚本 中 ， 我 们 使 用 declare 命令 来 创建 两 个 变量 ，upper 和 lower。 我 们 把 第 一 个 命令 行 参 数 的 值 (位 置 参 数 1) 赋 
给 每 一 个 变量 ， 然 后 把 变量 值 在 屏幕 上 显示 出 来 : 


[me@linuxbox ~]$ ul-declare aBc 
ABC 
abc 


正如 我 们 所 看 到 的 ， 命 令 行 参 数 (“aBc”) 已 经 规范 化 了 。 
有 四 个 参数 展开 ， 可 以 执行 大 小 写 转 换 操作 : 


表 34-1: 大 小 写 转 换 参 数 展开 


格式 结果 
${parameter,,} 把 parameter 的 值 全 部 展开 成 小 写字 母 。 
${parameter,} 仅仅 把 parameter 的 第 一 个 字符 展开 成 小 写字 母 。 
${parameter’^ 人 ^} 把 parameter 的 值 全 部 转换 成 大 写字 母 。 


${parameter 人 } 仅仅 把 parameter 的 第 一 个 字符 转换 成 大 写字 母 ( 首 字母 大 写 ) 。 


#!/bin/bash 
# ul-param - demonstrate case conversion via parameter expansion 
if [[ $1 ]]; then 

echo ${1,,} 

echo ${1,} 

echoB EL 人 

echo ${1^ 人 } 


这 里 是 脚本 运行 后 的 结果 : 


[me@linuxbox ~]$ ul-param aBc 
abc 
aBc 
ABC 
ABc 





再 次 ， 我 们 处 理 了 第 一 个 命 命 行 参数 ， 输 出 了 由 参数 展开 支持 的 四 种 变 体 。 尽 管 这 个 脚本 使 用 了 第 一 个 位 证 参数 ， 但 参数 可 
以 是 任意 字符 串 ， 变 量 ， 或 字符 串 表 达 式 。 


算术 求 值 和 展开 

我 们 在 第 七 章 中 已 经 接触 过 算术 展开 了 。 它 被 用 来 对 整数 执行 各 种 算术 运算 。 它 的 基本 格式 是 : 
$((expression)) 

这 里 的 expression 是 一 个 有 效 的 算术 表达 式 。 

这 个 与 复合 命令 (()) 有 关 ， 此 命令 用 做 算术 求 值 〈 真 测试 ) ， 我 们 在 第 27 章 中 遇 到 过 。 

在 之 前 的 章节 中 ， 我 们 看 到 过 一 些 类 型 的 表达 式 和 运算 符 。 这 里 ， 我 们 将 看 到 一 个 更 完整 的 列表 。 
数 基 


回 到 第 9 章 ， 我 们 看 过 八进制 (以 8 为 底 ) 和 十 六 进 制 〈 以 16 为 底 ) 的 数字 。 在 算术 表达 式 中 ，shell 支持 任意 进 制 的 整形 常 


量 。 
表 34-2: 指定 不 同 的 数 基 
表示 法 描述 
number 默认 情况 下 ， 没 有 任何 表示 法 的 数字 被 看 做 是 十 进 制 数 〈 以 10 为 底 ) 。 
Onumber 在 算术 表达 式 中 ， 以 需 开 头 的 数字 被 认为 是 八进制 数 。 
Oxnumber 十 六 进 制 表 示 法 
base#number number 以 base 为 底 
一 些 例 子 : 


[me@linuxbox ~]$ echo $((0Oxff)) 

2 

[me@linuxbox ~]$ echo $((2#11111111)) 
25 5 


在 上 面 的 示例 中 ， 我 们 打印 出 十 六 进 制 数 件 (最 大 的 两 位 数 ) 的 值 和 最 大 的 八 位 二 进 制 数 〈 以 2 为 底 ) 。 


一 元 运算 符 


有 两 个 二 元 运算 符 ，+ 和 -， 它 们 被 分 别 用 来 表示 一 个 数字 是 正 数 还 是 负数 。 例 如 ，-5。 


简单 算术 


下 表 中 列 出 了 普通 算术 运算 符 : 
表 34-3: 算术 运算 符 
运算 符 描述 
加 加 
减 
乘 
/ 整除 
乘 方 
% 取 模 (余数) 


其 中 大 部 分 运算 符 是 不 言 自明 的 ， 但 是 整除 和 取 模 运算 符 需 要 进一步 解释 一 下 。 


因为 shell 算术 只 操作 整形 ， 所 以 除法 运算 的 结果 总 是 整数 : 


[me@linuxbox ~]$ echo $(( 5/2)) 
2 


这 使 得 确定 除法 运算 的 余数 更 为 重要 : 


[me@linuxbox ~]$ echo $(( 5 % 2 )) 
a 


通过 使 用 除法 和 取 模 运算 符 ， 我 们 能 够 确定 5 除 以 2 得 数 是 2， 余 数 是 1。 


在 循环 中 计算 余数 是 很 有 用 处 的 。 在 循环 执行 期 间 ， 它 允许 某 一 个 操作 在 指定 的 间隔 内 执行 。 在 下 面 的 例子 中 ， 我们 显示 一 
行 数字 ， 并 高 之 显示 5 的 倍数 : 


#!/bin/bash 
# modulo : demonstrate the modulo operator 
for ((i = 0;i <= 20;i=i+ 1));do 
remainder=$((i % 5)) 
if (( remainder == 0 )); then 
printf "<%d> " $i 
else 


printf "%d " $i 
fi 
done 
PILE AAS 


当 脚本 执行 后 ， 输 出 结果 看 起 来 像 这 样 : 


[me@linuxbox ~]$ modulo 
O23 D> 0 09 <T0 IE < 5 > EO 19319 <20> 


赋值 运算 符 


尽管 它 的 使 用 不 是 那么 明显 ， 算 术 表 达 式 可 能 执行 赋值 运算 。 虽 然 在 不 同 的 上 下 文中 ， 我 们 已 经 执行 了 许多 次 赋值 运算 。 每 
次 我 们 给 变量 一 个 值 ， 我 们 就 执行 了 一 次 赋值 运算 。 我 们 也 能 在 算术 表达 式 中 执行 赋值 运算 : 


[me@linuxbox ~]$ foo= 

[me@linuxbox ~]$ echo $foo 

[me@linuxbox ~]$ if (( foo = 5 ));then echo "It is true."; fi 
lt is true. 

[me@linuxbox ~]$ echo $foo 

与 


在 上 面 的 例子 中 ， 首 先 我 们 给 变量 foo 赋 了 一 个 空 值 ， 然 后 验证 foo 的 确 为 空 。 下 一 步 ， 我 们 执行 一 个 计 复 合 命令 ((foo =5 
))。 这 个 过 程 完成 两 件 有 意思 的 事情 : 1) 它 把 5 赋值 给 变量 foo，2) 它 计 算 测 试 条 件 为 真 ， 因 为 foo 的 值 非 需 。 





注意 : 记 住 上 面 表达 式 中 = 符号 的 真正 含义 非常 重要 。 单 个 = 运算 符 执行 赋值 运算 。foo = 5 是 说 “使 得 foo 等 于 5”， == 
运算 符 计算 等 价 性 。foo == 5 是 说 “是 否 foo 等 于 5 ? "。 这 会 让 人 感到 非常 迷惑 ， 因 为 test 命令 接受 单个 = 运算 符 来 测试 字符 
串 等 价 性 。 这 也 是 使 用 更 现代 的 [[] 和 (( )) 复合 命令 来 代 蔡 test 命令 的 另 一 个 原因 。 


除了 = 运算 符 ，shell 也 提供 了 其 它 一 些 表示 法 ， 来 执行 一 些 非常 有 用 的 赋值 运算 : 


表 34-4: 赋值 运算 符 


表示 法 描述 
parameter = value 简单 赋值 。 给 parameter 赋值 。 
parameter += value 加 。 等 价 于 parameter = parameter + value。 
parameter -= value 减 。 等 价 于 parameter = parameter 一 value。 
parameter = value 乘 。 等 价 于 parameter = parameter value。 
parameter /= value 整除 。 等 价 于 parameter = parameter /value。 
parameter %= value 取 模 。 等 价 于 parameter = parameter % value。 
parameter++ 后 缀 自 增 变 量 。 等 价 于 parameter = parameter + 1 (但 ， 要 看 下 面 的 讨论 )。 
parameter-- 后 级 自 减 变量 。 等 价 于 parameter = parameter - 1。 
++parameter 前 级 自 增 变量 。 等 价 于 parameter = parameter + 1。 
--parameter 前 级 自 减 变 量 。 等 价 于 parameter = parameter - 1。 


这 些 赋值 运算 符 为 许多 常见 算术 任务 提供 了 快捷 方式 。 特 别 关注 一 下 自 增 (++) 和 自 减 〈--) 运算 符 ， 它 们 会 把 它们 的 参数 
值 加 1 或 减 1。 这 种 风格 的 表示 法 取 自 C 编程 语言 并 且 被 其 它 几 种 编程 语言 吸收 ， 包 括 bash。 





自 增 和 自 减 运算 符 可 能 会 出 现在 参数 的 前 面 或 者 后 面 。 然 而 它们 都 是 把 参数 值 加 1 或 减 1， 这 两 个 位 置 有 个 微小 的 差异 。 若 运 
算 符 放置 在 参数 的 前 面 ， 参 数值 会 在 参数 返回 之 前 增加 (或 减少 ) 。 若 放置 在 后 面 ， 则 运算 会 在 参数 返回 之 后 执行 。 这 相当 
奇怪 ， 但 这 是 它 预 期 的 行为 。 这 里 是 个 演示 的 例子 : 


[me@linuxbox ~]$ foo=1 
[me@linuxbox ~]$ echo $((foo++)) 
a 

[me@linuxbox ~]$ echo $foo 

2 


如 果 我 们 把 1 赋值 给 变量 foo， 然 后 通过 把 自 增 运算 符 ++ 放 到 参数 名 foo 之 后 来 增加 它 ，foo 返回 1。 然而 ， 如 果 我 们 第 二 次 
查看 变量 foo 的 值 ， 我 们 看 到 它 的 值 增加 了 1。 若 我 们 把 ++ 运算 符 放 到 参数 foo 之 前 ， 我 们 得 到 更 期 望 的 行为 : 


[me@linuxbox ~]$ foo=1 
[me@linuxbox ~]$ echo $((++foo)) 
2 

[me@linuxbox ~]$ echo $foo 

色 


对 于 大 多 数 shell 应 用 来 说 ， 前 级 运算 符 最 有 用 。 


自 增 ++ 和 自 减 -- 运算 符 经 常 和 循环 操作 结合 使 用 。 我 们 将 改进 我 们 的 modulo 脚本 ， 让 代码 更 紧凑 些 : 


#!/bin/bash 
# modulo2 : demonstrate the modulo operator 
for ((i = 0;i <= 20; ++i)); do 
if (((i % 5) == 0 )); then 
printf "<%d> " $i 
else 
printf "%d " $i 
fi 
done 
Ta 


位 运算 符 


位 运算 符 是 一 类 以 不 寻常 的 方式 操作 数字 的 运算 符 。 这 些 运 算 符 工作 在 位 级 别 的 数字 。 它 们 被 用 在 某 类 底层 的 任务 中 ， 经 常 
涉及 到 设置 或 读 取 位 标志 。 


表 34-5 : 位 运算 符 


运算 符 描述 
E 按 位 取 反 。 对 一 个 数字 所 有 位 取 反 。 
<< 位 左 移 . 把 一 个 数字 的 所 有 位 向 左 移动 。 
>> 位 右 移 . 把 一 个 数字 的 所 有 位 向 右 移 动 。 
& 位 与 。 对 两 个 数字 的 所 有 位 执行 一 个 AND 操作 。 
| 位 或 。 对 两 个 数字 的 所 有 位 执行 一 个 OR 操作 。 
位 异 或 。 对 两 个 数字 的 所 有 位 执行 一 个 异 或 操作 。 


注意 除了 按 位 取 反 运算 符 之 外 ， 其 它 所 有 位 运算 符 都 有 相对 应 的 赋值 运算 符 (例如 ，<\<=) 。 


这 里 我 们 将 演示 产生 2 的 千 列 表 的 操作 ， 使 用 位 左 移 运算 符 : 


[me@linuxbox ~]$ for ((i=0;i<8;++i)); do echo $((1<<i)); done 


逻辑 运算 符 


正如 我 们 在 第 27 章 中 所 看 到 的 ， 复 合 命令 (( )) 支持 各 种 各 样 的 比较 运算 符 。 还 有 一 些 可 以 用 来 计算 逻辑 运算 。 这 里 是 比较 运 
算 符 的 完整 列表 : 


表 34-6 : 比较 运算 符 


运算 符 描述 
<= 小 于 或 相等 
>= 大 于 或 相等 
< 小 于 
> 大 于 


== 相等 


I= 不 相等 


&& 逻辑 与 

| 逻辑 或 

expr1? 条 件 (三 元 ) 运算 符 。 若 表达 式 expr1 的 计算 结果 为 非 需 值 (算术 真 ) ， 则 执行 表达 式 expr2， 否 
expr2:expr3 则 执行 表达 式 expr3。 


当 表达 式 用 于 逻辑 运算 时 ， 表 达 式 遵循 算术 逻辑 规则 ; 也 就 是 ， 表 达 式 的 计算 结果 是 需 。 则 认为 假 ， 而 非 需 表达 式 认为 真 
该 (( )) 复合 命令 把 结果 映射 成 shell 正常 的 退出 码 : 


[me@linuxbox ~]$ if ((1)); then echo "true"; else echo "false"; fi 
true 
[me@linuxbox ~]$ if ((0)); then echo "true"; else echo "false"; fi 
false 


最 陌生 的 逻辑 运算 符 就 是 这 个 三 元 运算 符 了 。 这 个 运算 符 ( 仿 照 于 C 编程 语言 里 的 三 元 运算 符 ) 执行 一 个 单独 的 逻辑 测试 。 
它 用 起 来 类 似 于 if/then/else 语句 。 它 操作 三 个 算术 表达 式 (字符 串 不 会 起 作用 ) ， 并 且 若 第 一 个 表达 式 为 真 (或 非 需 ) ， 
则 执行 第 二 个 表达 式 。 否 则 ， 执 行 第 三 个 表达 式 。 我 们 可 以 在 命令 行 中 实验 一 下 : 


[me@linuxbox~]$ a=0 
[me@linuxbox~]$ ((a<1?++a:--a)) 
[me@linuxbox~]$ echo $a 

a 
[me@linuxbox~]$ ((a<1?++a:--a)) 
[me@linuxbox~]$ echo $a 

0 


这 里 我 们 看 到 一 个 实际 使 用 的 三 元 运算 符 。 这 个 例子 实现 了 一 个 切换 。 每 次 运算 符 执行 的 时 候 ， 变 量 a 的 值 从 替 变 为 1， 或 
反之 亦 然 。 


请 注意 在 表达 式 内 执行 赋值 却 并 非 易 事 。 


当 企 图 这 样 做 时 ，bash 会 声明 一 个 错误 : 


[me@linuxbox ~]$ a=0 
[me@linuxbox ~]$ ((a<1?a+=1:a-=1)) 
bash: ((:a<1l?a+=1:a-=1: attempted assignment to non-variable (error token is "-=1") 


过 把 赋值 表达 式 用 括号 括 起 来 ， 可 以 解决 这 


[me@linuxbox ~]$ ((a<1?(a+=1):(a-=1))) 


下 一 步 ， 我 们 看 一 个 使 用 算术 运算 符 更 完备 的 例子 ， 该 示例 产生 一 个 简单 的 数字 表格 : 


#!/bin/bash 
# arith-loop: script to demonstrate arithmetic operators 
finished=0 
a=0 
printf "a\ta**2\ta**3\n" 
printf "=\t====\t====\Nn" 
until ((finished)); do 
b=$((a**2)) 
c=$((a**3)) 
printf "%d\t%d\t%d\n" $a $b $c 
((a<10?++a:(finished=1))) 
done 


在 这 个 脚本 中 ， 我 们 基于 变量 finished 的 值 实现 了 一 个 until 循环 。 首 先 ， 把 变量 finished 的 值 设 为 需 (算术 假 ) ， 继续 执 


行 循 环 之 道 它 的 值 变 为 非 需 。 在 循环 体内 ， 我 们 计算 计数 器 a 的 平方 和 立方 。 在 循环 末尾 ， 计 算计 数 器 变量 a 的 值 。 若 它 小 
于 10 (最 大 迭代 次 数 ) ， 则 a 的 值 加 1， 否 则 给 变量 finished 赋值 为 1， 使 得 变量 finished 算术 为 真 ， 从 而 终止 循环 。 运 行 
该 脚本 得 到 这 样 的 结果 : 


[me@linuxbox ~]$ arith-loop 
> le | 


OO 0 
Ib L 
2 8 
39%9 27 
4 16 64 
S25 25 
G936 6 
7 49 343 
8 64 3 2 
9g:8l V2 
10 100 1000 


bc 一 一 种 高 精度 计算 器 话 于 


我 们 已 经 看 到 shell 是 可 以 处 理 所 有 类 型 的 整形 算术 的 ， 但 是 如 果 我 们 需要 执行 更 高 级 的 数学 运算 或 仅 使 用 浮 点 数 ， 该 怎么 
办 ? 答案 是 ， 我 们 不 能 这 样 做 。 至 少 不 能 直接 用 shell 完成 此 类 运算 。 为 此 ， 我 们 需要 使 用 外 部 程序 。 有 几 种 途径 可 供 我 们 
采用 。 艇 入 的 Perl 或 者 AWK 程序 是 一 种 可 能 的 方案 ， 但 是 不 幸 的 是 ， 超 出 了 本 书 的 内 容 大 纲 。 另 一 种 方式 就 是 使 用 一 种 专 
业 的 计算 器 程序 。 这 样 一 个 程序 叫做 bc， 在 大 多 数 Linux 系统 中 都 可 以 找到 。 


该 bc 程序 读 取 一 个 用 它 自己 的 类 似 于 C 语言 的 语法 编写 的 脚本 文件 。 一 个 bc 脚本 可 能 是 一 个 分 离 的 文件 或 者 是 读 取 标准 
输入 。bc 语言 支持 相当 少 的 功能 ， 包 括 变 量 ， 循 环 和 程序 员 定义 的 函数 。 这 里 我 们 不 会 讨论 整个 bc 语言 ， 仅仅 体验 一 下 。 
查看 bc 的 手册 页 ， 其 文档 整理 非常 好 。 


让 我 们 从 一 个 简单 的 例子 开始 。 我 们 将 编写 一 个 bc 脚本 来 执行 2 加 2 运算 : 


/# Avery simple bc script */ 
2+2 


脚本 的 第 一 行 是 一 行 注释 。bc 使 用 和 C 编程 语言 一 祥 的 注释 语法 。 注 释 ， 可 能 会 跨越 多 行 ， 开 始 于 /* 结束 于 */。 
使 用 bc 


如 果 我 们 把 上 面 的 bc 脚本 保存 为 foo.bc， 然 后 我 们 就 能 这 样 运行 它 : 


[me@linuxbox ~]$ bc foo.bc 

bc 1.06.94 

Copyright 1991-1994, 1997, 1998, 2000, 2004, 2006 Free Software 
Foundation, Inc. 

This is free software with ABSOLUTELY NO WARRANTY. 

For details type “warranty'. 

4 


如 果 我 们 仔细 观察 ， 我 们 看 到 算术 结果 在 最 底部 ， 版 权 信息 之 后 。 可 以 通过 -q (quiet) 选项 禁止 这 些 版 权 信息 。 bc 也 能 够 
交互 使 用 : 


[me@linuxbox ~]$ bc -q 
2+2 

4 

quit 


当 使 用 bc 交互 模式 时 ， 我 们 简单 地 输入 我 们 希望 执行 的 运算 ， 结 果 就 立即 显示 出 来 。bc 的 quit 命令 结束 交互 会 话 。 


也 可 能 通过 标准 输入 把 一 个 脚本 传递 给 bc 程序 : 


[me@linuxbox ~]$ bc < foo.bc 
4 


这 种 接受 标准 输入 的 能 力 ， 意 味 着 我 们 可 以 使 用 here 文档 ，here 字 符 串 ， 和 管道 来 传递 脚本 。 这 里 是 一 个 使 用 here 字符 串 
的 例子 : 


[me@linuxbox ~]$ bc <<< "2+2" 
4 


一 个 脚本 实例 


作为 一 个 真实 世界 的 例子 ， 我 们 将 构建 一 个 脚本 ， 用 于 计算 每 月 的 还 贷 金 额 。 在 下 面 的 脚本 中 ， 我 们 使 用 了 here 文档 把 一 
个 脚本 传递 给 bc : 


#!/bin/bash 
# loan-calc : script to calculate monthly loan payments 
PROGNAME=$(basename $0) 
usage () { 
cat <<- EOF 
Usage: $PROGNAME PRINCIPAL INTEREST MONTHS 
Where: 
PRINCIPAL is the amount of the loan. 
INTEREST is the APR as a number (7% = 0.07). 
MONTHS is the length of the loan's term. 
EOF 
} 
if (($# != 3)); then 
usage 
exit 1 
fi 
principal=$1 
interest=$2 
months=$3 
bc <<- EOF 
scale = 10 
i = $interest / 12 
p= $principal 
n= $months 
a Abr n(n ne 
DainteaRANn 
EOF 


当 脚本 执行 后 ， 输 出 结果 像 这 样 : 


[me@linuxbox ~]$ loan-calc 135000 0.0775 180 
475 
1270.7222490000 


若 贷 款 135,000 美金 ， 年 利率 为 7.75%， 借 贷 180 个 月 (15 年 ) ， 这 个 例子 计算 出 每 月 需要 还 贷 的 金额 。 注意 这 个 答案 的 精 
确 度 。 这 是 由 脚本 中 变量 scale 的 值 决定 的 。bc 的 手册 页 提供 了 对 bc 脚本 语言 的 详尽 描述 。 虽然 bc 的 数学 符号 与 shell 的 
略 有 差异 (bc 与 C 更 相近 ) ， 但 是 基于 目前 我 们 所 学 的 内 容 ， 大 多 数 符 号 是 我 们 相当 熟悉 的 。 

总 结 

在 这 一 章 中 ， 我 们 学 习 了 很 多 小 东西 ， 在 脚本 中 这 些小 雾 碎 可 以 完成 "真正 的 工作 "。 随 着 我 们 编写 脚本 经 验 的 增加 ， 能 够 有 
效 地 操作 字符 串 和 数字 的 能 力 将 具有 极为 重要 的 价值 。 我 们 的 loan-calc 脚本 表明 ， 蔬 至 可 以 创建 简单 的 脚本 来 完成 一 些 真 
正 有 用 的 事情 。 


额外 加 分 


虽然 该 loan-calc 脚本 的 基本 功能 已 经 很 到 位 了 ， 但 脚本 还 远 远 不 够 完善 。 为 了 额外 加 分 ， 试 着 给 脚本 loan-calc 添加 以 下 功 


bb， 
Be : 


e 用 一 个 命令 行 选项 来 实现 “交互 "模式 ， 提 示 用 户 输入 本 金 、 利 率 和 贷款 期 限 
。 输出 格式 美化 
拓展 阅读 

e。 《Bash Hackers Wiki》 对 参数 展开 有 一 个 很 好 的 论述 : 
http:/wiki.bash-hackers.org/syntax/pe 

e。 《Bash 参考 手册 》 也 介绍 了 这 个 : 
http:/www.gnu.org/software/bash/manual/bashref.html#Shell-Parameter-Expansion 

e。 Wikipedia 上 面 有 一 篇 很 好 的 文章 描述 了 位 运算 : 
http://en.wikipedia.org/Wwiki/Bit_operation 

e。 和 一 篇 关于 三 元 运算 的 文章 : 
http://en.wikipedia.org/wiki/Ternary_operation 

e 还 有 一 个 对 计算 还 贷 金额 公式 的 描述 ， 我 们 的 loan-calc 脚本 中 用 到 了 这 个 公式 : 


http://en.wikipedia.org/Wwiki/Amortization_calculator 


数组 


在 上 一 章 中 ， 我 们 查看 了 shell 怎样 操作 字符 串 和 数字 的 。 目 前 我 们 所 见 到 的 数据 类 型 在 计算 机 科学 圈 里 被 成 为 标量 变量 ; 
也 就 是 说 ， 只 能 包含 一 个 值 的 变量 。 


在 本 章 中 ， 我 们 将 看 看 另 一 种 数据 结构 叫做 数组 ， 数 组 能 存放 多 个 值 。 数 组 几乎 是 所 有 编程 语言 的 一 个 特性 。 shell 也 支持 
它们 ， 尽 管 以 一 个 相当 有 限 的 形式 。 即 便 如 此 ， 为 解决 编程 问题 ， 它 们 是 非常 有 用 的 。 


什么 是 数组 ? 


数组 是 一 次 能 存放 多 个 数据 的 变量 。 数 组 的 组 织 结构 就 像 一 张 表 。 我 们 拿 电 子 表格 举例 。 一 张 电 子 表 格 就 像 是 一 个 二 维 数 
组 。 它 既 有 行 也 有 列 ， 并 且 电 子 表格 中 的 一 个 单元 格 ， 可 以 通过 单元 格 所 在 的 行 和 列 的 地 址 定位 它 的 位 置 。 数组 行为 也 是 如 
此 。 数 组 有 单元 格 ， 被 称 为 元 素 ， 而 且 每 个 元 素 会 包含 数据 。 使 用 一 个 称 为 索引 或 下 标的 地 址 可 以 访问 一 个 单独 的 数组 元 
素 。 


大 多 数 编程 语言 支持 多 维 数组 。 一 个 电子 表格 就 是 一 个 多 维 数组 的 例子 ， 它 有 两 个 维度 ， 宽 度 和 高 度 。 许多 语言 支持 任意 维 
度 的 数组 ， 虽 然 二 维和 三 维 数组 可 能 是 最 常用 的 。 


Bash 中 的 数组 仅 限 制 为 单一 维度 。 我 们 可 以 把 它们 看 作 是 只 有 一 列 的 电子 表格 。 尽 管 有 这 种 局 限 ， 但 是 有 许多 应 用 使 用 它 
们 。 对 数组 的 支持 第 一 次 出 现在 bash 版 本 2 中 。 原 来 的 Unix shell 程序 ，sh， 根 本 就 不 支持 数组 。 


创建 一 个 数组 


数组 变量 就 像 其 它 bash 变量 一 样 命名 ， 当 被 访问 的 时 候 ， 它 们 会 被 自动 地 创建 。 这 里 是 一 个 例子 : 


[me@linuxbox ~]$ a[1]=foo 
[me@linuxbox ~]$ echo ${a[1]} 
foo 


这 里 我 们 看 到 一 个 赋值 并 访问 数组 元 素 的 例子 。 通 过 第 一 个 命令， 把 数组 a 的 元 素 1 赋值 为 “foo"”。 第 二 个 命令 显示 存储 在 元 
素 1 中 的 值 。 在 第 二 个 命令 中 使 用 花 括 号 是 必需 的 ， 以 便 防止 shell 试图 对 数组 元 素 名 执行 路 径 名 展开 操作 。 





也 可 以 用 declare 命令 创建 一 个 数组 : 
[me@linuxbox ~]$ declare -a a 


使 用 -a 选项 ，declare 命令 的 这 个 例子 创建 了 数组 a。 


数组 赋值 


有 两 种 方式 可 以 给 数组 赋值 。 单 个 值 赋值 使 用 以 下 语法 : 
name[subscript]=value 


这 里 的 name 是 数组 的 名 字 ，subscript 是 一 个 大 于 或 等 于 需 的 整数 (或 算术 表达 式 ) 。 注 意 数组 第 一 个 元 素 的 下 标 是 0， 而 
不 是 1。 数 组 元 素 的 值 可 以 是 一 个 字符 串 或 整数 。 


多 个 值 赋值 使 用 下 面 的 语法 : 
name=(valuel value2 ...) 


这 里 的 name 是 数组 的 名 字 ，value… 是 要 按照 顺序 赋 给 数组 的 值 ， 从 元 素 0 开 始 。 例 如 ， 如 果 我 们 希望 把 星期 几 的 英文 简写 
赋值 给 数组 days， 我 们 可 以 这 样 做 : 


[me@linuxbox ~]$ days=(Sun Mon Tue Wed Thu Fri Sat) 


还 可 以 通过 指定 下 标 ， 把 值 赋 给 数组 中 的 特定 元 素 : 








[me@linuxbox ~]$ days=([0]=Sun [1]=Mon [2]=Tue [3]=Wed [4]=Thu [5]=Fri [6]=Sat) 


访问 数组 元 素 


那么 数组 对 什么 有 好 处 呢 ? 就 像 许 多 数据 管理 任务 一 样 ， 可 以 用 电子 表格 程序 来 完成 ， 许 多 编程 任务 则 可 以 用 数组 完成 。 





让 我 们 考虑 一 个 简单 的 数据 收集 和 展示 的 例子 。 我 们 将 构建 一 个 脚本 ， 用 来 检查 一 个 特定 目录 中 文件 的 修改 次 数 。 从 这 些 数 
据 中 ， 我 们 的 脚本 将 输出 一 张 表 ， 显 示 这 些 文件 最 后 是 在 一 天 中 的 哪个 小 时 被 修改 的 。 这 样 一 个 脚本 可 以 被 用 来 确定 什么 时 
段 一 个 系统 最 活跃 。 这 个 脚本 ， 称 为 hours， 输 出 这 样 的 结果 : 


[me@linuxbox ~]$ hours . 
Hour Files Hour Files 


DO 是 DERETLLL 


NI ENET 7 
O200 40 中 
03a"00 lS 
B41 106 
(Oc 
06 6 18 4 
070399 198:4 
8 20 
oO 
T0220 22980 
3 0 


Total files = 80 


当 执行 该 hours 程序 时 ， 指 定 当 前 目录 作为 目标 目录 。 它 打印 出 一 张 表 显 示 一 天 (0-23 小 时 ) 每 小 时 内 ， 有 多 少 文件 做 了 最 
后 修改 。 程 序 代 码 如 下 所 示 : 





#!/bin/bash 
# hours : script to count files by modification time 
usage () { 
echo "usage: $(basename $0) directory" >&2 
上 
# Check that argument is a directory 
if [[ ! -d $1 ]]; then 
usage 
exit 1 
fi 
# Initialize array 
for i in {0..23}; do hours[i]=0; done 
# Collect data 
fori in $(stat -c %y "$1"/* | cut -c 12-13); do 
j=${i/#0} 
((++hours[j])) 
((++count)) 
done 
# Display data 
echo -e "Hour\tFiles\tHour\tFiles" 
echo -e "----\t-----\t----\t-----" 
ODDIn {0 Lyndo 
j=$((i + 12)) 
printf "%O2d\t%d\t%02d\t%d\n" $i ${hours[i]} $j ${hours[j]} 
done 
printf "\nTotal files = %d\n" $count 


这 个 脚本 由 一 个 函数 〈 名 为 usage) ， 和 一 个 分 为 四 个 区 块 的 主体 组 成 。 在 第 一 部 分 ， 我 们 检查 是 否 有 一 个 命令 行 参数 ， 且 
该 参数 为 目录 。 如 果 不 是 目录 ， 会 显示 脚本 使 用 信息 并 退出 。 


第 二 部 分 初始 化 一 个 名 为 hours 的 数组 。 给 每 一 个 数组 元 素 赋值 一 个 0。 虽 然 没有 特殊 需要 在 使 用 之 前 准 各 数组 ， 但 是 我 们 
的 脚本 需要 确保 没有 元 素 是 空 值 。 注 意 这 个 循环 构建 方式 很 有 趣 。 通 过 使 用 花 括 号 展开 ({0..23}) ， 我 们 能 很 容易 为 for 命 
今 产生 一 系列 的 数据 (words) 。 


接 下 来 的 一 部 分 收集 数据 ， 对 目录 中 的 每 一 个 文件 运行 stat 程序 。 我 们 使 用 cut 命令 从 结果 中 抽取 两 位 数字 的 小 时 字段 。 在 
循环 里 面 ， 我 们 需要 把 小 时 字段 开头 的 雳 清除 掉 ， 因 为 shell 将 试图 (最终 会 失败 ) 把 从 “00” 到 “09" 的 数值 解释 为 八进制 
( 见 表 34-1) 。 下 一 步 ， 我 们 以 小 时 为 数组 索引 ， 来 增加 其 对 应 的 数组 元 素 的 值 。 最 后 ， 我 们 增加 一 个 计数 器 的 值 

(count) ， 记 录 目 录 中 总 共 的 文件 数目 。 





脚本 的 最 后 一 部 分 显示 数组 中 的 内 容 。 我 们 首先 输出 两 行 标题 ， 然 后 进入 一 个 循环 产生 两 栏 输出 。 最 后 ， 输 出 总 共 的 文件 数 
目 。 


数组 操作 


有 许多 常见 的 数组 操作 。 上 比方 说 删除 数组 ， 确 定数 组 大 小 ， 排 序 ， 等 等 。 有 许多 脚本 应 用 程序 。 


输出 整个 数组 的 内 容 


下 标 * 和 @ 可 以 被 用 来 访问 数组 中 的 每 一 个 元 素 。 与 位 置 参 数 一 样 ，@ 表示 法 在 两 者 之 中 更 有 用 人 处。 这 里 是 一 个 演示 : 


[me@linuxbox ~]$ animals=("a dog" "a cat" "a fish") 
[me@linuxbox ~]$ for i in ${animals[*]}; do echo $i; done 


a 
dog 
a 


cat 

a 

fish 

[me@linuxbox ~]$ for i in ${animals[@]}; do echo $i; done 
a 

dog 

a 

cat 

a 

fish 

[me@linuxbox ~]$ for i in "${animals[*]}"; do echo $i; done 
a doga catafish 

[me@linuxbox ~]$ for i in "${animals[@]}"; do echo $i; done 
a dog 

a cat 

a fish 


我 们 创建 了 数组 animals， 并 把 三 个 含有 两 个 字 的 字符 串 赋 值 给 数组 。 然 后 我 们 执行 四 个 循环 看 一 下 对 数组 内 容 进行 分 词 的 
效果 。 表示 法 ${animals['} 和 $fanimals[@]} 的 行为 是 一 致 的 直到 它们 被 用 引号 引起 来 。 


确定 数组 元 素 个 数 


使 用 参数 展开 ， 我 们 能 够 确定 数组 元 素 的 个 数 ， 和 与 计算 字符 串 长 度 的 方式 几乎 相同 。 这 里 是 一 个 例子 


[me@linuxbox ~]$ a[100]=foo 

[me@linuxbox ~]$ echo ${#a[@]} # number of array elements 
iL 

[me@linuxbox ~]$ echo ${#a[100]} # length of element 100 
3 


我 们 创建 了 数组 a， 并 把 字符 串 “foo" 赋值 给 数组 元 素 100。 下 一 步 ， 我 们 使 用 参数 展开 来 检查 数组 的 长 度 ， 使 用 @ 表示 
法 。 最 后 ， 我 们 查看 了 包含 字符 串 “foo” 的 数组 元 素 100 的 长 度 。 有 趣 的 是 ， 尽 管 我 们 把 字符 串 赋 值 给 数组 元 素 100， bash 
仅仅 报告 数组 中 有 一 个 元 素 。 这 不 同 于 一 些 其 它 语言 的 行为 ， 数 组 中 未 使 用 的 元 素 (元 素 0-99) 会 初始 化 为 空 值 ， 并 把 它们 
计 入 数组 长 度 。 


找到 数组 使 用 的 下 标 


因为 bash 允许 赋值 的 数组 下 标 包含 “间隔 "， 有 时 候 确定 哪个 元 素 真 正 存在 是 很 有 用 的 。 为 做 到 这 一 点 ， 可 以 使 用 以 下 形式 
的 参数 展开 : 


${!larray[*]} 
$flarray[@]} 


这 里 的 array 是 一 个 数组 变量 的 名 字 。 和 其 它 使 用 符号 * 和 @ 的 展开 一 样 ， 用 引号 引起 来 的 @ 格式 是 最 有 用 的 ， 因为 它 能 
展开 成 分 离 的 词 。 





[me@linuxbox ~]$ foo=([2]=a [4]=b [6]=c) 
[me@linuxbox ~]$ for i in "${foo[@]}"; do echo $i; done 
a 

b 

E 

[me@linuxbox ~]$foriin "${!foo[@]}"; do echo $i; done 
2 

4 

6 





在 数组 末尾 添加 元 素 


如 果 我 们 需要 在 数组 末尾 附加 数据 ， 那 么 知道 数组 中 元 素 的 个 数 是 没 用 的 ， 因 为 通过 * 和 @ 表示 法 返回 的 数值 不 能 告诉 我 
们 使 用 的 最 大 数组 索引 。 幸 运 地 是 ，shell 为 我 们 提供 了 一 种 解决 方案 。 通 过 使 用 += 赋值 运算 符 ， 我 们 能 够 自动 地 把 值 附加 
到 数组 末尾 。 这 里 ， 我 们 把 三 个 值 赋 给 数组 foo， 然 后 附加 另外 三 个 。 


[me@linuxbox~]$ foo=(a b c) 
[me@linuxbox~]$ echo ${foo[@]} 
aibxc 

[me@linuxbox~]$ foo+=(d ef) 
[me@linuxbox~]$ echo ${foo[@]} 
abcdef 


数组 排序 


就 像 电子 表格 ， 经 常 有 必要 对 一 列 数据 进行 排序 。Shell 没有 这 样 做 的 直接 方法 ， 但 是 通过 一 点 儿 代码 ， 并 不 难 实现 。 


#!/bin/bash 

# array-sort : Sort an array 

a=(fedcba) 

echo "Original array: ${a[@]}" 

a_sorted=($(for i in "${a[@]}"; do echo $i; done | sort)) 
echo "Sorted array: ${a_sorted[@]}" 


当 执 行 之 后 ， 脚 本 产生 这 样 的 结果 : 


[me@linuxbox ~]$ array-sort 
Original array:fe dcba 
Sorted array: 

abcdef 


脚本 运行 成 功 ， 通 过 使 用 一 个 复杂 的 命令 蔡 换 把 原来 的 数组 (a) 中 的 内 容 复制 到 第 二 个 数组 〈a_sorted) 中 。 通过 修改 管 
道 线 的 设计 ， 这 个 基本 技巧 可 以 用 来 对 数组 执行 各 种 各 样 的 操作 。 


删除 数组 


删除 一 个 数组 ， 使 用 unset 命令 : 


[me@linuxbox ~]$ foo=(a bcdef) 
[me@linuxbox ~]$ echo ${foo[@]} 
abcdef 

[me@linuxbox ~]$ unset foo 
[me@linuxbox ~]$ echo ${foo[@]} 
[me@linuxbox ~]$ 


也 可 以 使 用 unset 命令 删除 单个 的 数组 元 素 : 


[me@linuxbox~]$ foo=(a bcdef) 
[me@linuxbox~]$ echo ${foo[@]} 
abcdef 

[me@linuxbox~]$ unset 'foo[2]' 
[me@linuxbox~]$ echo ${foo[@]} 
abdef 


在 这 个 例子 中 ， 我 们 删除 了 数组 中 的 第 三 个 元 素 ， 下 标 为 2。 记 住 ， 数 组 下 标 开 始 于 0， 而 不 是 1 ! 也 要 注意 数组 元 素 必须 用 
引号 引起 来 为 的 是 防止 shell 执行 路 径 名 展开 操作 。 


有 趣 地 是 ， 给 一 个 数组 赋 空 值 不 会 清空 数组 内 容 : 
[me@linuxbox ~]$ foo=(a bcdef) 

[me@linuxbox ~]$ foo= 

[ 


me@linuxbox ~]$ echo ${foo[@]} 
bcderf 


任何 引用 一 个 不 带 下 标的 数组 变量 ， 则 指 的 是 数组 元 素 0 : 


[me@linuxbox~]$ foo=(a bcdef) 
[me@linuxbox~]$ echo ${foo[@]} 
abcdef 

[me@linuxbox~]$ foo=A 
[me@linuxbox~]$ echo ${foo[@]} 
Abcdef 


关联 数组 


现在 最 新 的 bash 版 本 支持 关联 数组 了 。 关 联 数组 使 用 字符 串 而 不 是 整数 作为 数组 索引 。 这 种 功能 给 出 了 一 种 有 趣 的 新 方法 
来 管理 数据 。 例 如 ， 我 们 可 以 创建 一 个 叫做 “colors" 的 数组 ， 并 用 颜色 名 字 作为 索引 。 


declare -A colors 
colors["red"]="#ff0000" 
colors["green"]="#00ff00" 
colors["blue"]="#0000ff" 


不 同 于 整数 索引 的 数组 ， 仅 仅 引 用 它们 就 能 创建 数组 ， 关 联 数组 必须 用 带 有 -A 选项 的 declare 命令 创建 。 


访问 关联 数组 元 素 的 方式 几乎 与 整数 索引 数组 相同 : 
echo ${colors["blue"]} 


在 下 一 章 中 ， 我 们 将 看 一 个 脚本 ， 很 好 地 利用 关联 数组 ， 生 产 出 了 一 个 有 意思 的 报告 。 
总 结 


SN 


如 果 我 们 在 bash 手册 页 中 搜索 单词 “array" 的 话 ， 我 们 能 找到 许多 bash 在 哪里 会 使 用 数组 变量 的 实例 。 其 中 大 部 分 相当 了 星 


涩 难 懂 ， 但 是 它们 可 能 在 一 些 特殊 场合 提供 临时 的 工具 。 事 实 上 ， 在 shell 编程 中 ， 整 套数 组 规则 利用 率 相当 低 ， 很 大 程度 
上 为 丛 于 这 样 的 事实 ， 传统 Unix shell 程序 (比如 说 sh) 缺乏 对 数组 的 支持 。 这 样 缺 乏 人 气 是 不 幸 的 ， 因 为 数组 广泛 应 用 于 
其 它 编程 语言 ， 并 为 解决 各 种 各 祥 的 编程 问题 ， 提 供 了 一 个 强大 的 工具 。 
数组 和 循环 有 一 种 天 然 的 姻亲 关系 ， 它 们 经 常 被 一 起 使 用 。 该 
for ((expr expr expmD) 
形式 的 循环 尤其 适合 计算 数组 下 标 。 
拓展 阅读 
e Wikipedia 上 面 有 两 篇 关于 在 本 章 提 到 的 数据 结构 的 文章 : 
http:/en.wWikipedia.orgWwiki/Scalar_ (computing) 


http:/en.wikipedia.orgWwiki/Associative_array 


= iy 

育 珍 异 宝 

在 我 们 bash 学 习 旅 程 中 的 最 后 一 站 ， 我 们 将 看 一 些 需 星 的 知识 点 。 当 然 我 们 在 之 前 的 章节 中 已 经 涵盖 了 很 多 方面 ， 但 是 还 
有 许多 bash 特性 我 们 没有 涉及 到 。 其 中 大 部 分 特性 相当 隆 涩 ， 主 要 对 那些 把 bash 集成 到 Linux 发 行 版 的 程序 有 用 你 。 然 
而 还 有 一 些 特性 ， 虽 然 不 常用 ， 但 是 对 某 些 程序 问题 是 很 有 帮助 的 。 我 们 将 在 这 里 介绍 它们 。 

组 命令 和 子 shell 


bash 允许 把 命令 组 合 在 一 起 。 可 以 通过 两 种 方式 完成 ; 要 么 用 一 个 group 命令 ， 要 么 用 一 个 子 shell。 这 里 是 每 种 方式 的 语 
法 示例 : 


组 命令 : 

{command1; command2; [command3; ...]} 
子 shell : 

(command1; command2; [command3;...]) 


这 两 种 形式 的 不 同 之 处 在 于 ， 组 命令 用 花 括 号 把 它 的 命令 包 囊 起 来 ， 而 子 shell 用 括号 。 值 得 注意 的 是 ， 鉴 于 bash 实现 组 命 
兮 的 方式 ， 花 括号 与 命令 之 间 必 须 有 一 个 空格 ， 并 且 最 后 一 个 命令 必须 用 一 个 分 号 或 者 一 个 换行 符 终止 。 


那么 组 命 伟 和 子 shell 命 合 对 什么 有 好 处 呢 ? 尽管 它们 有 一 个 很 重要 的 差异 (我 们 马上 会 接触 到 ) ， 但 它们 都 是 用 来 管理 重 
定向 的 。 让 我 们 考虑 一 个 对 多 个 命令 执行 重 定向 的 脚本 片段 。 





ls -| > output.txt 
echo "Listing of foo.txt" >> output.txt 
cat foo.txt >> output.txt 


这 些 代码 相当 简洁 明了 。 三 个 命令 的 输出 都 重 定向 到 一 个 名 为 output.txt 的 文件 中 。 使 用 一 个 组 命令 ， 我 们 可 以 重新 编 写 这 
些 代码 ， 如 下 所 示 : 


{1s -l; echo "Listing of foo.txt"; cat foo.txt; } > output.txt 
使 用 一 个 子 shell 是 相似 的 : 
(ls -Il; echo "Listing of foo.txt"; cat foo.txt) > Output.txt 


使 用 这 样 的 技术 ， 我 们 为 我 们 自己 节省 了 一 些 打字 时 间 ， 但 是 组 命 信 和子 shell 真正 闪光 的 地 方 是 与 管道 线 相 结 合 。 当 构 建 
一 个 管道 线 命 邻 的 时 候 ， 通 常 把 几 个 命令 的 输出 结果 合并 成 一 个 流 是 很 有 用 的 。 组 命 信和 子 shell 使 这 种 操作 变 得 很 简单 : 


{ ls -l; echo "Listing of foo.txt"; cat foo.txt; } | Ipr 


这 里 我 们 已 经 把 我 们 的 三 个 命令 的 输出 结果 合并 在 一 起 ， 并 把 它们 用 管道 输送 给 命令 lpr 的 输入 ， 以 便 产 生 一 个 打印 报告 。 


在 下 面 的 脚本 中 ， 我 们 将 使 用 组 命令 ， 看 几 个 与 关联 数组 结合 使 用 的 编程 技巧 。 这 个 脚本 ， 称 为 array-2， 当 给 定 一 个 目录 
名 ， 打 印 出 目录 中 的 文件 列表 ， 伴随 着 每 个 文件 的 文件 所 有 者 和 组 所 有 者 。 在 文件 列表 的 末尾 ， 脚 本 打印 出 属于 每 个 所 有 者 
和 组 的 文件 数目 。 这 里 我 们 看 到 的 结果 (缩短 的 ， 为 简单 起 见 ) ， 是 给 定 脚本 的 目录 为 /usr/bin 的 时 候 : 





[me@linuxbox ~]$ array-2 /usr/bin 


/usrbin/2to3-2.6 root root 
/usr/bin/2to3 root root 
/usr/bin/a2p root root 
/usr/bin/abrowser root root 
/usrbin/aconnect root root 
/usr/bin/acpi_fakekey root root 
/usr/bin/acpi_listen root root 
/usr/bin/add-apt-repository root root 
/usr/bin/zipgrep root root 
/usr/bin/zipinfo root root 
/usr/bin/zipnote root root 
/usr/bin/zip root root 
/usr/bin/zipsplit root root 
/usr/bin/zjsdecode root root 
/usr/bin/zsoelim root root 
File owners: 


daemon :1 file(s) 


root 


: 1394 file(s) File group owners: 


crontab : 1 file(s) 
daemon :1 file(s) 
lpadmin : 1 file(s) 


mail :4 file(s) 
mlocate : 1 file(s) 
root :1380 file(s) 
shadow :2 file(s) 
ssh :1 file(s) 

tty :2 file(s) 


utmp :2 file(s) 


这 里 是 脚本 代码 列表 〈 带 有 行 号 ) 


中 ov、~voOmA 上 上 wN 哺 


上 上 
OO 


POOOOOOOOOOOOOUOOONDNNONONONNONNOOOOPooPPpoPPpoPppp 
Deeoo~omFcmwmNDhPoeooo、~om 和 swNPPoeooo、~ oawm 上 wwN 


#!/bin/bash 
# array-2: Use arrays to tally file owners 
declare -A files file_group file_ owner groups owners 


i cl lt hen 
echo "Usage: array-2 dir" >&2 
exit 1 

fi 


For i $l eo 
owner=$(stat -c %U "$i") 
group=$(stat -c %G "$i") 
files["$i"]="$i" 
file_owner["$i"]=$owner 
file_group["$i"]=$group 

((++owners[$owner])) 
((++groups[$group])) 
done 


# List the collected files 

{foriin "$f{files[@]}"; do 

printf "%-40s %-10s %-10s\n"\ 

"$i" $f{file owner["$i"]} ${file_group["$i"]} 
done } | sort 

echo 


# List owners 

echo "File owners:" 

{foriin"${!owners[@]}"; do 

printf "%-10s: %5d file(s)\n" "$i" ${owners["$i"]} 
done } | sort 

echo 


# List groups 

echo "File group owners:" 
{foriin"${!groups[@]}"; do 

printf "%-10s: %5d file(s)\n" "$i" ${groups["$i"]} 
done } | sort 


让 我 们 看 一 下 这 个 脚本 的 运行 机 制 : 

行 5 : 关联 数组 必须 用 带 有 -A 选项 的 declare 命令 创建 。 在 这 个 脚本 中 我 们 创建 了 如 下 五 个 数组 : 
files 包含 了 目录 中 文件 的 名 字 ， 按 文件 名 索引 

file_group 包含 了 每 个 文件 的 组 所 有 者 ， 按 文件 名 索引 


file_owner 包含 了 每 个 文件 的 所 有 者 ， 按 文件 名 索引 





groups 包含 了 属于 索引 的 组 的 文件 数目 





owners 包含 了 属于 索引 的 所 有 者 的 文件 数目 


行 7-10 : 查看 是 否 一 个 有 效 的 目录 名 作为 位 置 参 数 传递 给 程序 。 如 果 不 是 ， 就 会 显示 一 条 使 用 信息 ， 并 且 脚 本 退出 ， 退 出 状 
态 为 本 


行 12-20 : 循环 通 历 目录 中 的 所 有 文件 。 使 用 stat 命令 ， 行 13 和 行 14 抽 取 文 件 所 有 者 和 组 所 有 者 ， 并 把 值 赋 给 它们 各 自 的 数 
组 ( 行 16，17) ， 使 用 文件 名 作为 数组 索引 。 同 样 地 ， 文 件 名 自身 也 赋值 给 files 数组 。 





行 18-19 : 属于 文件 所 有 者 和 组 所 有 者 的 文件 总 数 各 自 加 1。 

行 22-27 : 输出 文件 列表 。 为 做 到 这 一 点 ， 使 用 了 “${array[@]}" 参数 展开 ， 展 开 成 整个 的 数组 元 素 列表 ， 并 且 每 个 元 素 被 当 
做 是 一 个 单独 的 词 。 从 而 允许 文件 名 包含 空格 的 情况 。 也 要 注意 到 整个 循环 是 包 囊 在 花 括号 中 ， 从 而 形成 了 一 个 组 命 舍 。 这 
样 就 允许 整个 循环 输出 会 被 管道 输送 给 sort 命令 的 输入 。 这 是 必要 的 ， 因 为 展开 的 数组 元 素 是 无 序 的 。 


行 29-40 : 这 两 个 循环 与 文件 列表 循环 相似 ， 除 了 它们 使 用 “${larray[@]}* 展开 ， 展 开 成 数组 索引 的 列表 而 不 是 数组 元 素 的 。 


进程 替换 
虽然 组 命 合 和 子 shell 看 起 来 相似 ， 并 且 它 们 都 能 用 来 在 重 定向 中 合并 流 ， 但 是 两 者 之 间 有 一 个 很 重要 的 不 同 。 然而 ， 一 个 
组 命令 在 当前 shell 中 执行 它 的 所 有 命令 ， 而 一 个 子 shell (顾名思义 ) 在 当前 shell 的 一 个 子 副本 中 执行 它 的 命令 。 这 意味 


着 运行 环境 被 复制 给 了 一 个 新 的 shell 实例 。 当 这 个 子 shell 退出 时 ， 环 境 副 本 会 消失 ， 所 以 在 子 shell 环境 (包括 变量 赋 
值 ) 中 的 任何 更 改 也 会 消失 。 因 此 ， 在 大 多 数 情况 下 ， 除 非 脚本 要 求 一 个 子 shell， 组 命令 比 子 shell 更 受 欢迎 。 组 命令 运行 
很 快 并 且 占 用 的 内 存 也 少 。 


我 们 在 第 20 章 中 看 到 过 一 个 子 shell 运行 环境 问题 的 例子 ， 当 我 们 发 现 管道 线 中 的 一 个 read 命令 不 按 我 们 所 期 望 的 那样 工 
作 的 时 候 。 为 了 重 现 问题 ， 我 们 构建 一 个 像 这 样 的 管道 线 : 





echo "foo" | read 
echo $REPLY 


该 REPLY 变量 的 内 容 总 是 为 空 ， 是 因为 这 个 read 命令 在 一 个 子 shell 中 执行 ， 所 以 它 的 REPLY 副本 会 被 毁 掉 ， 当 该 子 
shell 终止 的 时 候 。 因 为 管道 线 中 的 命令 总 是 在 子 shell 中 执行 ， 任 何 给 变量 赋值 的 命令 都 会 遭遇 这 样 的 问题 。 幸运 地 
是 ，shell 提供 了 一 种 奇异 的 展开 方式 ， 叫 做 进程 替换 ， 它 可 以 用 来 解决 这 种 麻烦 。 进 程 替换 有 两 种 表达 方式 : 


一 种 适用 于 产生 标准 输出 的 进程 : 


<(list) 


另 一 种 适用 于 接受 标准 输入 的 进程 : 


>(list) 


这 里 的 list 是 一 串 命令 列表 : 


为 了 解决 我 们 的 read 命令 问题 ， 我 们 可 以 履 佣 进程 蔡 换 ， 像 这 样 : 


read < <(echo "foo") 
echo $REPLY 


进程 替换 允许 我 们 把 一 个 子 shell 的 输出 结果 当 作 一 个 用 于 重 定向 的 普通 文件 。 事 实 上 ， 因 为 它 是 一 种 展开 形式 ， 我 们 可 以 


检验 它 的 真实 值 : 


[me@linuxbox ~]$ echo <(echo "foo") 
/dev/fd/63 


通过 使 用 echo 命 伟 ， 查 看 展开 结果 ， 我 们 看 到 子 shell 的 输出 结果 ， 由 一 个 名 为 /dev/fd/63 的 文件 提供 。 


进程 替换 经 常 被 包含 read 命令 的 循环 用 到 。 这 里 是 一 个 read 循环 的 例子 ， 人 处 理 一 个 
shell : 


#1!/bin/bash 
# pro-sub : demo of process substitution 
while read attr links owner group size date time filename; do 


cat <<- EOF 
Filename: $filename 
Size: $size 
Owner: $owner 
Group: $group 
Modified: $date $time 
Links: $links 
Attributes: $attr 

EQEF 


done < <(ls -| | tail -n +2) 








目录 列表 的 内 容 ， 内 容 创 建 于 一 个 子 


这 个 循环 对 目录 列表 的 每 一 个 条 目 执行 read 命令 。 列 表 本 身 产生 于 该 脚本 的 最 后 一 行 代 码 。 这 一 行 代码 把 从 进程 蔡 换 得 到 的 
输出 重 定向 到 这 个 循环 的 标准 输入 。 这 个 包含 在 管道 线 中 的 tail 命令 ， 是 为 了 消除 列表 的 第 一 行文 本 ， 这 行文 本 是 多 余 的 。 





当 脚本 执行 后 ， 脚 本 产生 像 这 样 的 输出 : 


[me@linuxbox ~]$ pro_sub | head -n 20 
Filename: addresses.ldif 
Size: 14540 

Owner: me 

Group: me 

Modified: 2009-04-02 11:12 
Links: 

下 

Attributes: -rw-r--r-- 
Filename: bin 

Size: 4096 

Owner: me 

Group: me 

Modified: 2009-07-10 07:31 
Ginks2 

Attributes: drwxr-xr-x 
Filename: bookmarks.html 
Size: 394213 

Owner: me 

Group: me 


陷阱 


在 第 10 章 中 ， 我 们 看 到 过 程序 是 怎样 响应 信号 的 。 我 们 也 可 以 把 这 个 功能 添加 到 我 们 的 脚本 中 。 然 而 到 目前 为 止 ， 我 们 所 编 


写 过 的 脚本 还 不 需要 这 种 功能 (因为 它们 运行 时 间 非 常 短暂 ， 并 且 不 创建 临时 文件 ) 


言 息 处 理 程序 。 


当 我 们 设计 一 个 大 的 ， 复 条 的 脚本 的 时 候 ， 若 脚本 仍 在 运行 时 ， 用 户 注销 或 关闭 了 电脑 ， 


大 且 更 复杂 的 脚本 可 能 会 受益 于 一 个 


这 时 候 会 发 生 什 么 ， 考 虑 到 这 一 点 


非常 重要 。 当 像 这 样 的 事情 发 生 了 ， 一 个 信号 将 会 发 送 给 所 有 受到 影响 的 进程 。 依 次 地 ， 代 表 这 些 进 程 的 程序 会 执行 相应 的 
动作 ， 来 确保 程序 合理 有 序 的 终止 。 比 方 说 ， 例 如 ， 我 们 编写 了 一 个 会 在 执行 时 创建 临时 文件 的 脚本 。 在 一 个 好 的 设计 流 
程 ， 我 们 应 该 让 脚本 删除 创建 的 临时 文件 ， 当 脚本 完成 它 的 任务 之 后 。 若 脚本 接收 到 一 个 信号 ， 表 明 该 程序 即将 提前 终止 的 
信号 ， 此 时 让 脚本 删除 创建 的 临时 文件 ， 也 会 是 很 精巧 的 设计 。 


为 满足 这 样 需求 ，bash 提供 了 一 种 机 制 ， 众 所 周知 的 trap。 陷 阱 由 被 恰当 命令 的 内 部 命令 trap 实现 。 trap 使 用 如 下 语法 : 
trap argument signal [signal...] 
这 里 的 argument 是 一 个 字符 串 ， 它 被 读 取 并 被 当 作 一 个 命令 ，signal 是 一 个 信号 的 说 明 ， 它 会 触发 执行 所 要 解释 的 命令 。 


这 里 是 一 个 简单 的 例子 : 


#!/bin/bash 
# trap-demo : simple signal handling demo 
trap "echo '| am ignoring you." SIGINT SIGTERM 
Tor dg 

echo "Iteration $i of 5" 

sleep5 
done 


这 个 脚本 定义 一 个 陷 嘲 ， 当 脚本 运行 的 时 候 ， 这 个 陷阱 每 当 接受 到 一 个 SIGINT 或 SIGTERM 信号 时 ， 就 会 执行 一 个 echo 命 
今 。 当 用 户 试图 通过 按 下 Ctrl-c 组 合 键 终止 脚本 运行 的 时 候 ， 该 程序 的 执行 结果 看 起 来 像 这 样 : 


[me@linuxbox ~]$ trap-demo 
Iteration 1 of 5 

Iteration 2 of 5 

l am ignoring you. 

Iteration 3 of 5 

l am ignoring you. 

Iteration 4 of 5 

Iteration 5 of 5 








正如 我 们 所 看 到 的 ， 每 次 用 户 试图 中 断 程序 时 ， 会 打印 出 这 条 信息 。 


构建 一 个 字符 串 形 成 一 个 有 用 的 命令 序列 是 很 笨拙 的 ， 所 以 通常 的 做 法 是 指定 一 个 shell 函数 作为 命令 。 在 这 个 例子 中 ， 为 
每 一 个 信号 指定 了 一 个 单独 的 shell 函数 来 处 理 : 


#!/bin/bash 
# trap-demo2 : simple signal handling demo 
exit on_signal_SIGINT () { 
echo "Script interrupted." 2>&1 
exit 0 
} 
exit on_signal_SIGTERM () { 
echo "Script terminated." 2>&1 
exit 0 
trap exit on_signal_SIGINT SIGINT 
trap exit on_signal_SIGTERM SIGTERM 
pinm E500 
echo "Iteration $i of 5" 
sleep5 
done 


这 个 脚本 的 特色 是 有 两 个 trap 命令 ， 每 个 命令 对 应 一 个 信号 。 每 个 trap， 依 次 ， 当 接受 到 相应 的 特殊 信号 时 ， 会 执行 指定 的 
shell 函数 。 注 意 每 个 信号 处 理 函 数 中 都 包含 了 一 个 exit 命令 。 没 有 exit 命令 ， 信号 处 理 画 数 执行 完 后 ， 该 脚本 将 会 继续 执 
行 。 





当 用 户 在 这 个 脚本 执行 期 间 ， 按 下 Ctrl-c 组 合 键 的 时 候 ， 输 出 结果 看 起 来 像 这 样 : 


[me@linuxbox ~]$ trap-demo2 
Iteration 1 of 5 

Iteration 2 of 5 

Script interrupted. 


临时 文件 


把 信号 处 理 程序 包含 在 脚本 中 的 一 个 原因 是 删除 临时 文件 ， 在 脚本 执行 期 间 ， 肢 本 可 能 会 创建 临时 文件 来 存放 中 间 结 
果 。 命名 临时 文件 是 一 种 艺术 。 传 统 上 ， 在 类 似 于 unix 系统 中 的 程序 会 在 mp 目录 下 创建 它们 的 临时 文件 ，/tmp 是 
一 个 服务 于 临时 文件 的 共享 目录 。 然 而 ， 因 为 这 个 目录 是 共享 的 ， 这 会 引起 一 定 的 安全 顾虑， 尤其 对 那些 用 超级 用 户 
特权 运行 的 程序 。 除 了 为 暴露 给 系统 中 所 有 用 户 的 文件 设置 合适 的 权限 ， 这 一 明显 步骤 之 外 ， 给 临时 文件 一 个 不 可 预 
测 的 文件 名 是 很 重要 的 。 这 就 避免 了 一 种 为 大 众 所 知 的 temp race 攻击 。 一 种 创建 一 个 不 可 预测 的 〈 但 是 仍 有 意义 

的 ) 临时 文件 名 的 方法 是 ， 做 一 些 像 这 样 的 事情 : 























tempfile=/tmp/$(basename $0).$$.$RANDOM 


ba 


将 创建 一 个 由 程序 名 字 ， 程 序 进程 的 ID (PID) 文件 名 ， 和 一 个 随机 整数 组 成 。 注 意 ， 然 而 ， 该 $RANDOM shel 
量 只 能 返回 一 个 范围 在 1-32767 内 的 整数 值 ， 这 在 计算 机 术语 中 不 是 一 个 很 大 的 范围 ， 所 以 一 个 单一 的 该 变量 实例 
足以 克服 一 个 坚定 的 攻击 者 的 。 


Pm 党 忌 
pd 





一 个 比较 好 的 方法 是 使 用 mktemp 程序 (不 要 和 mktemp 标准 库 琐 数 相 混淆 ) 来 命名 和 创建 临时 文件 。 这 个 mktemp 
程序 接受 一 个 用 于 创建 文件 名 的 模板 作为 参数 。 这 个 模板 应该 包含 一 系列 的 “X" 字符 ， 随后 这 些 字符 会 被 相应 数量 的 
随机 字母 和 数字 替换 掉 。 一 连 串 的 “X” 字符 越 长 ， 则 一 连 串 的 随机 字符 也 就 越 长 。 这 里 是 一 个 例子 : 





tempfile=$(mktemp /tmp/foobar.$$.XXXXXXXXXX) 





这 里 创建 了 一 个 临时 文件 ， 并 把 临时 文件 的 名 字 赋 值 给 变量 tempfile。 因 为 模板 中 的 “X" 字符 会 被 随机 字母 和 数字 代 
蔡 ， 所 以 最 终 的 文件 名 〈 在 这 个 例子 中 ， 文 件 名 也 包含 了 特殊 参数 $$ 的 展开 值 ， 进 程 的 PID) 可 能 像 这 样 : 


/tmp/foobar.6593.UOZuvM6654 





对 于 那些 由 普通 用 户 操作 执行 的 脚本 ， 避 免 使 用 /tmp 目录 ， 而 是 在 用 户主 目录 下 为 临时 文件 创建 一 个 目录 ， 通过 像 这 
样 的 一 行 代码 : 


[[-d $HOME/tmp J] || mkdir $HOME/tmp 


异步 执行 


有 时 候 需要 同时 执行 多 个 任务 。 我 们 已 经 知道 现在 所 有 的 操作 系统 若 不 是 多 用 户 的 但 至 少 是 多 任务 的 。 脚本 也 可 以 构建 成 多 
任务 处 理 的 模式 。 


通常 这 涉及 到 启动 一 个 脚本 ， 依 次 ， 启动 一 个 或 多 个 子 脚本 来 执行 额外 的 任务 ， 而 父 脚本 继续 运行 。 然 而 ， 当 一 系列 脚本 以 
这 种 方式 运行 时 ， 要 保持 父子 脚本 之 间 协 调 工 作 ， 会 有 一 些 问 题 。 也 就 是 说 ， 若 父 脚本 或 子 脚本 依赖 于 另 一 方 ， 并 且 一 个 脚 
本 必须 等 待 另 一 个 脚本 结束 任务 之 后 ， 才 能 完成 它 自己 的 任务 ， 这 应 该 怎么 办 ? 


bash 有 一 个 内 置 命令 ， 能 帮助 管理 诸如 此 类 的 异步 执行 的 任务 。wait 命令 导致 一 个 父 脚 本 暂停 运行 ， 直 到 一 个 特定 的 进程 
(例如 ， 子 脚本 ) 运行 结束 。 


首先 我 们 将 演示 一 下 wait 命令 的 用 法 。 为 此 ， 我 们 需要 两 个 脚本 ， 一 个 父 脚 本 : 


#!/bin/bash 

# async-parent : Asynchronous execution demo (parent) 
echo "Parent: starting..." 

echo "Parent: launching child script..." 

async-child & 

pid=$! 
echo "Parent: child (PID= $pid) launched." 
echo "Parent: continuing..." 

sleep 2 
echo "Parent: pausing to wait for child to finish..." 
wait $pid 

echo "Parent: child is finished. Continuing..." 
echo "Parent: parent is done. Exiting." 





和 一 个 子 脚 本 : 


#!/bin/bash 

# async-child : Asynchronous execution demo (child) 
echo "Child: child is running..." 

sleep 5 

echo "Child: child is done. Exiting." 


在 这 个 例子 中 ， 我 们 看 到 该 子 脚本 是 非常 简单 的 。 真 正 的 操作 通过 父 脚本 完成 。 在 父 脚 本 中 ， 子 脚本 被 启动 ， 并 被 放置 到 后 
台 运 行 。 子 脚本 的 进程 ID 记录 在 pid 变量 中 ， 这 个 变量 的 值 是 $1 shell 参数 的 值 ， 它 总 是 包含 放 到 后 台 执 行 的 最 后 一 个 任务 
的 进程 ID 号 。 

父 脚 本 继续 ， 然 后 执行 一 个 以 子 进程 PID 为 参数 的 wait 命 舍 。 这 就 导致 父 脚本 暂停 运行 ， 直 到 子 脚本 退出 ， 意味 着 父 脚本 
结 o 


当 执 行 后 ， 父 子 脚本 产生 如 下 输出 : 


[me@linuxbox ~]$ async-parent 

Parent: starting... 

Parent: launching child script... 

Parent: child (PID= 6741) launched. 
Parent: continuing... 

Child: child is running... 

Parent: pausing to wait for child to finish... 
Child: child is done. Exiting. 

Parent: child is finished. Continuing... 
Parent: parent is done. Exiting. 


命名 管道 


在 大 多 数 类 似 也 Unix 的 操作 系统 中 ， 有 可 能 创建 一 种 特殊 类 型 的 俄 文件 ， 叫 做 命名 管道 。 命 名 管道 用 来 在 两 个 进程 之 间 建 
立 连 接 ， 也 可 以 像 其 它 类 型 的 文件 一 样 使 用 。 虽 然 它们 不 是 那么 流行 ， 但 是 它们 值得 我 们 去 了 解 。 


有 一 种 常见 的 编程 架构 ， 叫 做 客户 端 -服务 器 ， 它 可 以 利用 像 命名 管道 这 样 的 通信 方式 ， 也 可 以 使 用 其 它 类 型 的 进程 间 通 信 方 
式 ， 比 如 网 络 连接 。 


最 为 广泛 使 用 的 客户 端 -服务 器 系统 类 型 是 ， 当 然 ， 一 个 web 浏览 器 与 一 个 web 服务 器 之 间 进 行 通信 。 web 浏览 器 作为 客户 
端 ， 向 服务 器 发 出 请 求 ， 服 务 器 响应 请 求 ， 并 把 对 应 的 网 页 发 送 给 浏览 器 


命 邻 管 道 的 行为 类 似 于 文件 ， 0 (FIFO) 的 缓冲 。 和 普通 (未 命令 的 ) 管道 一 样 ， 数 据 从 一 端 进入 ， 
然后 从 另 一 端 出 现 。 通 过 命令 管道 ， 有 可 能 像 这 样 设置 一 些 示 西 : 


processl > named_pipe 


和 


process2 < named_pipe 
表现 出 来 就 像 这 样 : 


processl | process2 


设置 一 个 命名 管道 


首先 ， 我 们 必须 创建 一 个 命名 管道 。 使 用 mkfifo 命令 能 够 创建 命令 管道 : 


[me@linuxbox ~]$ mkfifo pipel 
[me@linuxbox ~]$ ls -| pipel 
prw-r--r-- 1 me 

me 

0 2009-07-17 06:41 pipel 


这 里 我 们 使 用 mkfifo 创建 了 一 个 名 为 pipe1 的 命名 管道 。 使 用 Is 命 舍 ， 我 们 查看 这 个 文件 ， 看 到 位 于 属性 字段 的 第 一 个 字 


母 是 “p"， 表 明 它 是 一 个 命名 管道 。 
使 用 命名 管道 


为 了 演示 命名 管道 是 如 何 工作 的 ， 我 们 将 需要 两 个 终端 窗口 (或 用 两 个 虚拟 控制 台 代替 ) 。 在 第 一 个 终端 中 ， 我 们 输入 一 个 
简单 命 售 ， 并 把 命令 的 输出 重 定向 到 命名 管道 : 








[me@linuxbox ~]$ ls -| > pipel 


我 们 按 下 Enter 按键 之 后 ， 命 邻 将 会 挂 起 。 这 是 因为 在 管道 的 另 一 端 没 有 任何 接受 数据 。 当 这 种 现象 发 生 的 时 候 ， 据说 是 管 
道 阻塞 了 。 一 旦 我 们 绑 定 一 个 进程 到 管道 的 另 一 端 ， 该 进程 开始 从 管道 中 读 取 输入 的 时 人 息 ， 这 种 情况 会 消失 。 使 用 第 二 个 终 
端 窗口 ， 我 们 输入 这 个 命令 : 





[me@linuxbox ~]$ cat < pipel 


然后 产 自 第 一 个 终端 窗口 的 目录 列表 出 现在 第 二 个 终端 中 ， 并 作为 来 自 cat 命令 的 输出 。 在 第 一 个 终端 窗口 中 的 ls 命 合 一 旦 
它 不 再 阻塞 ， 会 成 功 地 结束 。 


总 结 


AN 





吧 ， 我 们 已 经 完成 了 我 们 的 旅程 。 现 在 剩 下 的 唯一 要 做 的 事 就 是 练习 ， 练 习 ， 再 练习 。 纵然 在 我 们 的 长 途 跋 涉 中 ， 我 们 涉及 
了 很 多 命令 ， 但 是 就 命令 行 而 言 ， 我 们 只 是 触及 了 它 的 表面 。 仍 留 有 成 千 上 万 的 命令 行程 序 ， 需 要 去 发 现 和 享受 。 开 始 挖掘 
/usrbin 目录 吧 ， 你 将 会 看 到 ! 





拓展 阅读 

e bash 手册 页 的 “复合 命令 " 部 分 包含 了 对 组 命令 和 子 shell 表示 法 的 详尽 描述 。 

e bash 手册 也 的 EXPANSION 部 分 包含 了 一 小 部 分 进程 蔡 换 的 内 容 : 

。 《高 级 Bash 脚本 指南 》 也 有 对 进程 蔡 换 的 讨论 : 
http://tldp.org/LDP/abs/html/process-sub.html 


e 《Linux 杂志 》 有 两 篇 关于 命令 管道 的 好 文章 。 第 一 篇 ， 源 于 1997 年 9 月 : 





http:/www.linuxjournal.comy/article/2156 


e 和 第 二 篇 ， 源 于 2009 年 3 月 : 


http://www.linuxjournal.com/content/using-named-pipes-fifos-bash 


